qwen/qwen3-next-80b-a3b-thinkingQwen3-Next-80B-A3B-Thinking — это ориентированная на рассуждения чат-модель в линейке Qwen3-Next, которая по умолчанию выводит структурированные цепочки мыслей. Она разработана для решения сложных многоэтапных задач: математических доказательств, синтеза и отладки кода, логических выводов и планирования действий агентов. Модель демонстрирует высокие результаты в тестах на эрудицию, логику, программирование, соответствие инструкциям и мультиязычность. По сравнению с предыдущими вариантами Qwen3, данная версия отличается стабильностью при построении длинных логических цепочек и эффективным масштабированием во время инференса. Она настроена на точное выполнение сложных инструкций при минимальном количестве повторов или отклонений от темы.
Модель подходит для использования в агентных фреймворках, вызова функций (tool use), рабочих процессов с интенсивным поиском информации (RAG) и стандартизированных бенчмарков, где требуются пошаговые решения. Она поддерживает генерацию длинных детальных ответов и использует методы оптимизации пропускной способности, такие как предсказание нескольких токенов, для ускорения работы. Обратите внимание, что модель функционирует в режиме вывода рассуждений. Все возможности доступны через API alltokens.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-next-80b-a3b-thinking",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Qwen: Qwen3 Next 80B A3B Thinking от провайдера qwen доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
262 144 токенов
Цена входа
13 ₽ / 1M токенов
Цена выхода
97 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
Qwen: Qwen3.5 Plus 2026-04-20
qwen
Qwen3.5 Plus (апрель 2026) — крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, поддерживая контекстное окно размером 1 миллион токенов.
Qwen: Qwen3.6 Flash
qwen
Qwen3.6 Flash — это быстрый и эффективный языковой модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов.
Qwen: Qwen3.6 35B A3B
qwen
Qwen3.6-35B-A3B — это мультимодальная модель с открытыми весами от Alibaba Cloud, содержащая 35 миллиардов параметров, из которых 3 миллиарда активируются для каждого токена. Модель использует гибридную разреженную архитектуру mixture-of-experts с механизмом Gated.
Qwen: Qwen3.6 Max Preview
qwen
Qwen3.6-Max-Preview — это собственная передовая модель Alibaba Cloud, построенная на архитектуре разреженного смешения экспертов с примерно 1 триллионом параметров. Она оптимизирована для агентного программирования, использования инструментов и других задач.
Qwen: Qwen3.6 27B
qwen
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba и выпущенная в апреле 2026 года. Модель обладает гибридными мультимодальными возможностями — принимает на вход текст, изображения и видео.
Qwen: Qwen3.6 Plus
qwen
Qwen 3.6 Plus основан на гибридной архитектуре, сочетающей эффективное линейное внимание с разреженным маршрутизатором смеси экспертов, что обеспечивает высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он обеспечивает...
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку