qwen/qwen3-embedding-8bСерия моделей Qwen3 Embedding — это новейшая разработка в семействе Qwen, специально созданная для задач встраивания текста и ранжирования. Данная серия унаследовала исключительные мультиязычные возможности, навыки понимания длинных текстов и логического вывода от своей базовой модели. Серия Qwen3 Embedding демонстрирует значительные успехи в различных задачах обработки текста, включая поиск текстовой информации, поиск кода, классификацию, кластеризацию и поиск параллельных корпусов текстов.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl -X POST https://api.alltokens.ru/api/v1/embeddings \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"input": "The quick brown fox jumps over the lazy dog",
"model": "qwen/qwen3-embedding-8b",
"dimensions": 1536
}'Qwen: Qwen3 Embedding 8B от провайдера qwen доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
32 000 токенов
Цена эмбеддингов
2 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
Qwen: Qwen3.5 Plus 2026-04-20
qwen
Qwen3.5 Plus (апрель 2026) — крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, поддерживая контекстное окно размером 1 миллион токенов.
Qwen: Qwen3.6 Flash
qwen
Qwen3.6 Flash — это быстрый и эффективный языковой модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов.
Qwen: Qwen3.6 35B A3B
qwen
Qwen3.6-35B-A3B — это мультимодальная модель с открытыми весами от Alibaba Cloud, содержащая 35 миллиардов параметров, из которых 3 миллиарда активируются для каждого токена. Модель использует гибридную разреженную архитектуру mixture-of-experts с механизмом Gated.
Qwen: Qwen3.6 Max Preview
qwen
Qwen3.6-Max-Preview — это собственная передовая модель Alibaba Cloud, построенная на архитектуре разреженного смешения экспертов с примерно 1 триллионом параметров. Она оптимизирована для агентного программирования, использования инструментов и других задач.
Qwen: Qwen3.6 27B
qwen
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba и выпущенная в апреле 2026 года. Модель обладает гибридными мультимодальными возможностями — принимает на вход текст, изображения и видео.
Qwen: Qwen3.6 Plus
qwen
Qwen 3.6 Plus основан на гибридной архитектуре, сочетающей эффективное линейное внимание с разреженным маршрутизатором смеси экспертов, что обеспечивает высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он обеспечивает...
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку