qwen/qwen3.5-flash-02-23Модели Qwen3.5 Flash с нативной поддержкой визуально-языковых задач построены на гибридной архитектуре, объединяющей механизм линейного внимания с разреженной моделью смеси экспертов, что обеспечивает более высокую эффективность логического вывода. По сравнению с третьей серией, эти модели демонстрируют качественный скачок производительности как в текстовых, так и в мультимодальных задачах, обеспечивая быстрый отклик при оптимальном балансе скорости генерации и общего качества работы.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.5-flash-02-23",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Qwen: Qwen3.5-Flash от провайдера qwen доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
1 000 000 токенов
Цена входа
9 ₽ / 1M токенов
Цена выхода
33 ₽ / 1M токенов
Входные модальности
Выходные модальности
Qwen: Qwen3.5 Plus 2026-04-20
qwen
Qwen3.5 Plus (апрель 2026) — крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, поддерживая контекстное окно размером 1 миллион токенов.
Qwen: Qwen3.6 Flash
qwen
Qwen3.6 Flash — это быстрый и эффективный языковой модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов.
Qwen: Qwen3.6 35B A3B
qwen
Qwen3.6-35B-A3B — это мультимодальная модель с открытыми весами от Alibaba Cloud, содержащая 35 миллиардов параметров, из которых 3 миллиарда активируются для каждого токена. Модель использует гибридную разреженную архитектуру mixture-of-experts с механизмом Gated.
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку
Добавлена в каталог
25.02.2026
Мультимодальные модели
Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.
Смотреть подборку