Alltokens

Новости

Новые модели, обновления цен и улучшения возможностей.

Подборки моделей

PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Компактная модель встраивания (embeddings) от Perplexity с 0,6 млрд параметров, оптимизированная для быстрого поиска в веб-масштабах. Она обеспечивает низкую задержку при генерации векторов и поддерживает внушительный контекст до 32 000 токенов.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Perplexity: Embed V1 0.6B — это компактная и быстрая модель для создания текстовых эмбеддингов, оптимизированная для плотного поиска в веб-масштабах. При объеме в 0.6 млрд параметров она обеспечивает минимальную задержку при генерации векторов, поддерживая контекст до 32 000 токенов.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Intfloat18 ноября 2025 г.

Intfloat: E5-Base-v2

E5-Base-v2 — это эффективная модель эмбеддингов, предназначенная для преобразования английских текстов в плотные векторы размерностью 768. Она оптимизирована для задач семантического поиска и оценки сходства текстов, обеспечивая высокую точность при умеренных вычислительных затратах.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Sentence-transformers18 ноября 2025 г.

Sentence Transformers: paraphrase-MiniLM-L6-v2

Компактная и быстрая модель эмбеддингов, оптимизированная для поиска парафраз и семантического сходства. Она преобразует текст в векторы размерностью 384, обеспечивая высокую точность при минимальных вычислительных затратах.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Sentence-transformers18 ноября 2025 г.

Sentence Transformers: all-MiniLM-L12-v2

Компактная и быстрая модель для создания векторных представлений текста, оптимизированная для семантического поиска и кластеризации. Она преобразует предложения в 384-мерные векторы, обеспечивая отличный баланс между производительностью и качеством обработки коротких фрагментов текста.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Baai18 ноября 2025 г.

BAAI: bge-base-en-v1.5

Компактная и эффективная модель эмбеддингов для английского языка, преобразующая текст в 768-мерные векторы. Версия 1.5 оптимизирована для задач семантического поиска, сопоставления документов и построения систем RAG.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
Sentence-transformers17 ноября 2025 г.

Sentence Transformers: all-mpnet-base-v2

Модель all-mpnet-base-v2 преобразует текст в плотные 768-мерные векторы, обеспечивая высокую точность семантического поиска и кластеризации. Она оптимизирована для работы с предложениями и короткими абзацами, демонстрируя отличные результаты в задачах сопоставления сходства.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Sentence-transformers17 ноября 2025 г.

Sentence Transformers: all-MiniLM-L6-v2

Компактная и эффективная модель эмбеддингов, преобразующая текст в 384-мерные векторы для семантического поиска и кластеризации. Она оптимизирована для быстрой обработки коротких предложений и абзацев с сохранением высокого качества представлений.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Thenlper18 ноября 2025 г.

Thenlper: GTE-Large

GTE-Large — это специализированная модель эмбеддингов, предназначенная для преобразования английского текста в плотные векторы размерностью 1024. Она оптимизирована для задач семантического поиска, ранжирования и анализа сходства текстов средней длины.

Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
Intfloat18 ноября 2025 г.

Intfloat: Multilingual-E5-Large

Multilingual-E5-Large — это мощная модель эмбеддингов, предназначенная для преобразования текста в 1024-мерные векторы на более чем 90 языках. Она оптимизирована для задач семантического поиска и кросс-языкового анализа, обеспечивая высокую точность сопоставления документов.

Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииПеревод+2
Читать →
Baai18 ноября 2025 г.

BAAI: bge-large-en-v1.5

BAAI: bge-large-en-v1.5 — это высокоэффективная модель эмбеддингов, преобразующая английский текст в плотные 1024-мерные векторы. Она оптимизирована для задач семантического поиска и извлечения документов, обеспечивая высокую точность сопоставления смыслов.

Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
QwenQwen28 октября 2025 г.

Qwen: Qwen3 Embedding 8B

Qwen3 Embedding 8B — это современная проприетарная модель для создания текстовых эмбеддингов и ранжирования. Она отличается выдающейся мультиязычностью и поддержкой длинных контекстов до 32 000 токенов.

Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
OpenaiOpenai30 октября 2025 г.

OpenAI: Text Embedding 3 Small

Высокопроизводительная модель эмбеддингов от OpenAI, пришедшая на смену популярной архитектуре Ada. Она преобразует текст в числовые векторы с контекстным окном до 8192 токенов, обеспечивая точное измерение семантической близости фрагментов данных.

Вход: 3 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
QwenQwen28 октября 2025 г.

Qwen: Qwen3 Embedding 4B

Qwen3 Embedding 4B — это современная проприетарная модель для создания векторных представлений текста с поддержкой длинного контекста до 32 768 токенов. Она демонстрирует выдающиеся результаты в мультиязычных задачах и операциях ранжирования, опираясь на архитектурные достижения семейства Qwen.

Вход: 3 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+2
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, оптимизированная для плотного поиска информации в веб-масштабах. Благодаря 4 миллиардам параметров она обеспечивает максимальное качество извлечения данных и поддерживает контекст до 32 000 токенов.

Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, специально оптимизированная для плотного поиска информации в веб-масштабах. Обладая 4 миллиардами параметров, она обеспечивает максимальное качество извлечения данных и поддерживает внушительное контекстное окно в 32 000 токенов.

Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Clip Preview

Lyria 3 Clip Preview — это специализированная модель Google для генерации высококачественного стерео-аудио с частотой 48 кГц. Она позволяет создавать короткие музыкальные клипы, лупы и превью на основе текстовых промптов или изображений, обеспечивая структурную связность вокала и инструментов.

Цена: 5 ₽ за клип
ТехнологииМаркетинг+1
Читать →
Inclusionai21 апреля 2026 г.

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве автономного агента. Благодаря 7.4 млрд активных параметров она обеспечивает мгновенный отклик и высокую точность при выполнении сложных инструкций.

Вход: 2 ₽/MВыход: 4 ₽/M
ТехнологииПрограммирование+1
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Pro Preview

Lyria 3 Pro Preview — это передовая модель Google для генерации полноценных музыкальных композиций в качестве 48 кГц. Она способна создавать структурированные треки с вокалом и инструменталом на основе текстовых описаний или изображений.

Цена: 10 ₽ за композицию
ТехнологииМаркетинг+1
Читать →
MistralaiMistralai31 октября 2025 г.

Mistral: Mistral Embed 2312

Mistral Embed — это специализированная модель для создания текстовых эмбеддингов с размерностью 1024, оптимизированная для задач семантического поиска. Она эффективно обрабатывает контекст до 8192 токенов, обеспечивая высокую точность в RAG-системах.

Вход: 13 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
OpenaiOpenai30 октября 2025 г.

OpenAI: Text Embedding 3 Large

Text Embedding 3 Large — это наиболее мощная модель эмбеддингов от OpenAI, предназначенная для преобразования текста в высокоточные числовые векторы. Она демонстрирует исключительную эффективность в задачах поиска и анализа семантической близости как для английского, так и для множества других языков.

Вход: 17 ₽/MВыход: 0 ₽/M
ТехнологииНаука+2
Читать →
Ibm-granite20 октября 2025 г.

IBM: Granite 4.0 Micro

IBM Granite 4.0 Micro — это компактная модель с 3 миллиардами параметров, оптимизированная для работы с длинными контекстами до 131 000 токенов. Она представляет собой эффективное решение для быстрой обработки текстовых данных, сочетая высокую скорость работы с актуальными методами дообучения от IBM.

Вход: 3 ₽/MВыход: 14 ₽/M
ТехнологииНаука+2
Читать →
Liquid25 февраля 2026 г.

LiquidAI: LFM2-24B-A2B

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Вход: 4 ₽/MВыход: 15 ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle31 октября 2025 г.

Google: Gemini Embedding 001

Gemini Embedding 001 — это передовая модель для создания векторных представлений текста, демонстрирующая высокие результаты в бенчмарке MTEB. Она обеспечивает глубокое понимание контекста в таких сложных областях, как юриспруденция, финансы и программирование.

Вход: 19 ₽/MВыход: 0 ₽/M
ТехнологииНаука+3
Читать →
Ibm-granite30 апреля 2026 г.

IBM: Granite 4.1 8B

IBM Granite 4.1 8B — это компактная и эффективная языковая модель, оптимизированная для корпоративных задач и работы с длинными контекстами до 131 тысячи токенов. Она демонстрирует высокую точность в структурировании данных и использовании инструментов, что делает её надежным решением для автоматизации бизнес-процессов.

Вход: 7 ₽/MВыход: 13 ₽/M
ТехнологииФинансы+2
Читать →
OpenaiOpenai05 августа 2025 г.

OpenAI: gpt-oss-20b

OpenAI: gpt-oss-20b — это открытая модель с архитектурой Mixture-of-Experts (MoE), предлагающая высокую эффективность при 21 миллиарде параметров. Благодаря 3,6 миллиардам активных параметров и внушительному контекстному окну в 128k токенов, она обеспечивает быстрые и точные ответы для широкого спектра задач.

Вход: 4 ₽/MВыход: 18 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen21 июля 2025 г.

Qwen: Qwen3 235B A22B Instruct 2507

Qwen3-235B-A22B — это мощная мультиязычная модель с архитектурой Mixture-of-Experts, оптимизированная для точного следования сложным инструкциям. Благодаря огромному контекстному окну в 262 144 токена, она эффективно справляется с анализом длинных документов и генерацией связного текста.

Вход: 9 ₽/MВыход: 13 ₽/M
ТехнологииПеревод+2
Читать →
QwenQwen10 марта 2026 г.

Qwen: Qwen3.5-9B

Qwen3.5-9B — это эффективная мультимодальная модель, объединяющая возможности обработки текста, изображений и видео в компактной архитектуре. Благодаря раннему слиянию токенов и контекстному окну в 262 144 токена, она демонстрирует высокие результаты в логических рассуждениях и программировании.

Вход: 5 ₽/MВыход: 19 ₽/M
ПрограммированиеТехнологии+2
Читать →
GoogleGoogle17 апреля 2026 г.

Google: Gemini Embedding 2 Preview

Gemini Embedding 2 Preview — это первая мультимодальная модель эмбеддингов от Google, способная преобразовывать текст, изображения, видео и PDF в единое векторное пространство. Она идеально подходит для создания продвинутых систем семантического поиска и реализации RAG-сценариев с использованием разнородных данных.

Вход: 25 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Arcee-ai01 декабря 2025 г.

Arcee AI: Trinity Mini

Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.

Вход: 6 ₽/MВыход: 19 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia05 сентября 2025 г.

NVIDIA: Nemotron Nano 9B V2

NVIDIA Nemotron Nano 9B V2 — это компактная и эффективная модель, обученная с нуля для решения широкого спектра задач. Она объединяет в себе возможности логического рассуждения и стандартной генерации текста, предлагая внушительное контекстное окно в 131 072 токена.

Вход: 5 ₽/MВыход: 20 ₽/M
ТехнологииНаука+2
Читать →
Rekaai20 марта 2026 г.

Reka Edge

Reka Edge — это высокоэффективная мультимодальная модель на 7 миллиардов параметров, специализирующаяся на глубоком анализе изображений и видео. Она демонстрирует отличные результаты в распознавании объектов и работе в качестве автономного агента с использованием инструментов.

Вход: 13 ₽/MВыход: 13 ₽/M
ТехнологииНаука+1
Читать →
Z-ai24 июля 2025 г.

Z.ai: GLM 4 32B

GLM 4 32B — это сбалансированная языковая модель, оптимизированная для решения сложных интеллектуальных задач при высокой скорости работы. Она демонстрирует отличные результаты в программировании, поиске информации в сети и эффективном использовании внешних инструментов.

Вход: 13 ₽/MВыход: 13 ₽/M
ПрограммированиеТехнологии+2
Читать →
OpenaiOpenai05 августа 2025 г.

OpenAI: gpt-oss-120b

gpt-oss-120b — это открытая модель от OpenAI с архитектурой Mixture-of-Experts, оптимизированная для сложных логических задач и работы в качестве ИИ-агента. Благодаря активации всего 5.1 млрд параметров при каждом проходе, она сочетает высокую производительность с глубоким пониманием контекста до 128 тысяч токенов.

Вход: 5 ₽/MВыход: 23 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia14 декабря 2025 г.

NVIDIA: Nemotron 3 Nano 30B A3B

NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 262 144 токенов и высокой вычислительной точности, она идеально подходит для развертывания в частной инфраструктуре.

Вход: 7 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
MistralaiMistralai20 июня 2025 г.

Mistral: Mistral Small 3.2 24B

Обновленная модель Mistral Small 3.2 с 24 миллиардами параметров демонстрирует значительный прогресс в точности следования инструкциям и работе с функциональными вызовами. Благодаря расширенному контекстному окну и мультимодальным возможностям, она эффективно справляется с анализом текста и изображений, минимизируя повторы в ответах.

Вход: 10 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Essentialai07 декабря 2025 г.

EssentialAI: Rnj 1 Instruct

EssentialAI: Rnj 1 Instruct — это компактная модель с 8 миллиардами параметров, обученная с нуля для решения сложных аналитических задач. Она демонстрирует высокую эффективность в программировании, математических вычислениях и научном поиске.

Вход: 19 ₽/MВыход: 19 ₽/M
ПрограммированиеНаука+2
Читать →
Bytedance22 июля 2025 г.

ByteDance: UI-TARS 7B

UI-TARS 7B от ByteDance — это специализированная мультимодальная модель, оптимизированная для управления графическими интерфейсами через зрение. Она эффективно работает с десктопными приложениями, веб-браузерами и мобильными системами благодаря обучению с подкреплением.

Вход: 13 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+1
Читать →
Tencent22 апреля 2026 г.

Tencent: Hy3 preview

Tencent Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в агентских сценариях. Она поддерживает гибкую настройку уровней рассуждения, что позволяет адаптировать её под задачи разной сложности в производственных средах.

Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-Flash

Qwen3.5-Flash — это быстрая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE. Она обеспечивает мгновенный отклик при работе с текстом, изображениями и видео, поддерживая контекст до 1 миллиона токенов.

Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen31 июля 2025 г.

Qwen: Qwen3 Coder 30B A3B Instruct

Qwen3 Coder 30B A3B Instruct — это продвинутая модель на архитектуре Mixture-of-Experts, специально оптимизированная для написания кода и работы с масштабными репозиториями. Благодаря поддержке контекста до 160 000 токенов и продвинутому использованию инструментов, она эффективно справляется с задачами агентного программирования.

Вход: 9 ₽/MВыход: 34 ₽/M
ПрограммированиеТехнологии+2
Читать →
Baidu12 августа 2025 г.

Baidu: ERNIE 4.5 21B A3B

ERNIE 4.5 21B A3B — это продвинутая модель на базе архитектуры Mixture-of-Experts (MoE), оптимизированная для эффективной обработки текста и мультимодального понимания. Благодаря активации всего 3 миллиардов параметров на токен, она обеспечивает высокую скорость генерации при сохранении глубокого контекста до 120 000 токенов.

Вход: 9 ₽/MВыход: 35 ₽/M
ТехнологииПеревод+2
Читать →
DeepseekDeepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это высокопроизводительная модель с архитектурой Mixture-of-Experts, оптимизированная для мгновенного отклика. Благодаря поддержке контекстного окна в 1 миллион токенов, она идеально подходит для обработки сверхдлинных документов и сложного анализа данных.

Вход: 16 ₽/MВыход: 32 ₽/M
ПрограммированиеТехнологии+3
Читать →
Bytedance-seed23 декабря 2025 г.

ByteDance Seed: Seed 1.6 Flash

Seed 1.6 Flash — это сверхбыстрая мультимодальная модель от ByteDance, поддерживающая глубокое мышление и анализ визуального контента. Благодаря контекстному окну в 256k токенов, она эффективно справляется с обработкой объемных документов и сложных медиафайлов.

Вход: 10 ₽/MВыход: 38 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
OpenaiOpenai29 октября 2025 г.

OpenAI: gpt-oss-safeguard-20b

Специализированная модель от OpenAI на базе архитектуры MoE, предназначенная для обеспечения безопасности и фильтрации контента. Она обладает низким временем отклика и оптимизирована для задач классификации текстов и модерации в реальном времени.

Вход: 10 ₽/MВыход: 38 ₽/M
ТехнологииНаука+1
Читать →
GoogleGoogle03 апреля 2026 г.

Google: Gemma 4 26B A4B

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Вход: 8 ₽/MВыход: 41 ₽/M
ТехнологииПрограммирование+2
Читать →
MistralaiMistralai02 декабря 2025 г.

Mistral: Ministral 3 14B 2512

Ministral 3 14B — это флагманская модель в линейке Ministral, предлагающая производительность уровня Mistral Small 24B при более компактном размере. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки сложных данных.

Вход: 25 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen29 июля 2025 г.

Qwen: Qwen3 30B A3B Instruct 2507

Qwen3 30B A3B Instruct — это эффективная модель на архитектуре Mixture-of-Experts, использующая всего 3.3 млрд активных параметров для быстрой генерации. Она обладает внушительным контекстным окном в 262 тысячи токенов и оптимизирована для точного следования сложным инструкциям.

Вход: 12 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Stepfun29 января 2026 г.

StepFun: Step 3.5 Flash

Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации всего 11 миллиардов параметров из 196 миллиардов, она обеспечивает мгновенные ответы и поддерживает внушительное контекстное окно в 256 тысяч токенов.

Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Xiaomi14 декабря 2025 г.

Xiaomi: MiMo-V2-Flash

MiMo-V2-Flash — это открытая языковая модель от Xiaomi, построенная на архитектуре Mixture-of-Experts с гибридным вниманием. При общем объеме в 309 млрд параметров она задействует лишь 15 млрд активных весов, обеспечивая высокую скорость генерации при огромном контекстном окне в 262 тысячи токенов.

Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
MistralaiMistralai30 октября 2025 г.

Mistral: Voxtral Small 24B 2507

Voxtral Small 24B — это продвинутая мультимодальная модель, объединяющая текстовые возможности Mistral Small 3 с функциями обработки аудио. Она демонстрирует высокую точность в транскрибации, переводе и глубоком понимании аудиоконтента при сохранении отличных показателей в текстовых задачах.

Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПеревод+1
Читать →
MistralaiMistralai10 июля 2025 г.

Mistral: Devstral Small 1.1

Devstral Small 1.1 — это специализированная модель на 24 миллиарда параметров, оптимизированная для задач программной инженерии и создания ИИ-агентов. Разработанная совместно с All Hands AI на базе Mistral Small 3.1, она сочетает компактность с высокой эффективностью в написании и анализе кода.

Вход: 13 ₽/MВыход: 38 ₽/M
ПрограммированиеТехнологии+1
Читать →
Microsoft17 октября 2025 г.

Microsoft: Phi 4 Mini Instruct

Phi-4-mini-instruct — это компактная и эффективная модель от Microsoft, обученная на высококачественных синтетических данных с упором на логическое мышление. Несмотря на малый размер, она демонстрирует отличные результаты в задачах рассуждения и обработки длинных контекстов до 128 000 токенов.

Вход: 10 ₽/MВыход: 44 ₽/M
ТехнологииПрограммирование+2
Читать →
OpenaiOpenai07 августа 2025 г.

OpenAI: GPT-5 Nano

GPT-5 Nano — это самая компактная и быстрая модель в линейке GPT-5, спроектированная для мгновенного отклика и работы в средах с минимальной задержкой. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 400 000 токенов, что делает её идеальной для оперативной обработки больших объемов данных.

Вход: 7 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai19 января 2026 г.

Z.ai: GLM 4.7 Flash

Z.ai: GLM 4.7 Flash — это высокопроизводительная модель класса 30B, оптимизированная для задач программирования и сложного планирования. Благодаря внушительному контекстному окну более 200 тысяч токенов, она эффективно справляется с анализом объемных документов и разработкой комплексных ИИ-агентов.

Вход: 8 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen28 августа 2025 г.

Qwen: Qwen3 30B A3B Thinking 2507

Qwen3 30B A3B Thinking — это специализированная модель на базе архитектуры Mixture-of-Experts, ориентированная на глубокое логическое рассуждение. Она поддерживает расширенные цепочки мыслей, что позволяет эффективно решать сложные многоэтапные задачи в рамках внушительного контекстного окна.

Вход: 10 ₽/MВыход: 50 ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle02 апреля 2026 г.

Google: Gemma 4 31B

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.

Вход: 15 ₽/MВыход: 46 ₽/M
ПрограммированиеТехнологии+2
Читать →
Bytedance-seed26 февраля 2026 г.

ByteDance Seed: Seed-2.0-Mini

Seed-2.0-Mini — это легковесная мультимодальная модель от ByteDance, оптимизированная для задач с высокой нагрузкой и жесткими требованиями к скорости ответа. Она поддерживает контекст до 256k токенов и предлагает четыре режима сложности рассуждений для гибкого управления ресурсами.

Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Nvidia10 октября 2025 г.

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

NVIDIA Llama 3.3 Nemotron Super 49B — это оптимизированная версия модели Llama-3.3-70B, сфокусированная на рассуждениях и агентских сценариях. Благодаря контекстному окну в 128K и глубокой постобработке, она отлично справляется с математикой, кодом и сложными RAG-системами.

Вход: 13 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
GoogleGoogle25 сентября 2025 г.

Google: Gemini 2.5 Flash Lite Preview 09-2025

Gemini 2.5 Flash Lite Preview — это сверхлегкая модель, ориентированная на минимальную задержку и высокую пропускную способность при сохранении способностей к рассуждению. Она поддерживает мультимодальный ввод и обладает огромным контекстным окном в 1 миллион токенов.

Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг+2
Читать →
GoogleGoogle22 июля 2025 г.

Google: Gemini 2.5 Flash Lite

Gemini 2.5 Flash Lite — это сверхлегкая мультимодальная модель, оптимизированная для мгновенной генерации текста и обработки огромных объемов данных. Она поддерживает контекстное окно до 1 миллиона токенов, позволяя анализировать длинные документы, видео и аудио с минимальными задержками.

Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
QwenQwen23 октября 2025 г.

Qwen: Qwen3 VL 32B Instruct

Qwen3-VL-32B-Instruct — это мощная мультимодальная модель с 32 миллиардами параметров, оптимизированная для глубокого анализа изображений и видео. Она поддерживает контекстное окно до 131 072 токенов, обеспечивая высокую точность в задачах визуального восприятия и логического вывода.

Вход: 13 ₽/MВыход: 52 ₽/M
ТехнологииНаука+2
Читать →
Nousresearch26 августа 2025 г.

Nous: Hermes 4 70B

Hermes 4 70B — это гибридная модель от Nous Research, построенная на базе Llama-3.1-70B и поддерживающая продвинутый режим рассуждений. Она сочетает в себе высокую производительность базовой архитектуры с улучшенными способностями к логическому анализу сложных задач.

Вход: 17 ₽/MВыход: 50 ₽/M
ТехнологииНаука+2
Читать →
Nvidia11 марта 2026 г.

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.

Вход: 12 ₽/MВыход: 56 ₽/M
ПрограммированиеТехнологии+2
Читать →
Alibaba18 сентября 2025 г.

Tongyi DeepResearch 30B A3B

Tongyi DeepResearch 30B A3B — это специализированная агентная модель, оптимизированная для глубокого поиска и анализа информации в рамках длинных контекстных окон. Благодаря архитектуре MoE она активирует всего 3 миллиарда параметров на токен, обеспечивая высокую эффективность при решении сложных исследовательских задач.

Вход: 12 ₽/MВыход: 56 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen14 октября 2025 г.

Qwen: Qwen3 VL 8B Instruct

Qwen3-VL-8B-Instruct — это компактная мультимодальная модель, оптимизированная для глубокого анализа изображений и видео. Благодаря технологии Interleaved-MRoPE она эффективно обрабатывает длинные последовательности данных, обеспечивая высокую точность в задачах визуального рассуждения.

Вход: 10 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
Arcee-ai27 января 2026 г.

Arcee AI: Trinity Large Preview

Arcee AI Trinity Large Preview — это масштабная модель с архитектурой Mixture-of-Experts (MoE), использующая 400 миллиардов параметров при высокой эффективности работы. Она демонстрирует выдающиеся результаты в креативном письме и сложных аналитических задачах благодаря продвинутой системе маршрутизации экспертов.

Вход: 19 ₽/MВыход: 56 ₽/M
ТехнологииНаука+2
Читать →
DeepseekDeepseek01 декабря 2025 г.

DeepSeek: DeepSeek V3.2

DeepSeek V3.2 — это мощная языковая модель, использующая инновационный механизм разреженного внимания DSA для достижения высокой вычислительной эффективности. Она оптимизирована для сложных рассуждений и уверенной работы с инструментами в агентских сценариях.

Вход: 32 ₽/MВыход: 47 ₽/M
ТехнологииПрограммирование+2
Читать →
Nex-agi08 декабря 2025 г.

Nex AGI: DeepSeek V3.1 Nex N1

Флагманская модель серии Nex-N1, прошедшая специализированное дообучение для повышения автономности и эффективности работы с инструментами. Она ориентирована на решение практических задач и демонстрирует высокую производительность в сценариях реального мира.

Вход: 17 ₽/MВыход: 63 ₽/M
ТехнологииПрограммирование+2
Читать →
Allenai21 ноября 2025 г.

AllenAI: Olmo 3 32B Think

Olmo 3 32B Think — это специализированная модель на 32 миллиарда параметров, разработанная для глубоких рассуждений и решения сложных логических задач. Она отлично справляется с многошаговыми инструкциями и демонстрирует высокую точность в аналитических сценариях.

Вход: 19 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen06 октября 2025 г.

Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct — это продвинутая мультимодальная модель, объединяющая глубокое понимание визуального контента с мощной текстовой генерацией. Она оптимизирована для выполнения сложных инструкций, анализа изображений и видео, обеспечивая высокую точность восприятия в рамках длинного контекстного окна.

Вход: 17 ₽/MВыход: 65 ₽/M
ТехнологииНаука+2
Читать →
DeepseekDeepseek29 сентября 2025 г.

DeepSeek: DeepSeek V3.2 Exp

DeepSeek V3.2 Exp — это экспериментальная языковая модель, представляющая архитектурный мост к будущим поколениям нейросетей DeepSeek. Она внедряет инновационный механизм разреженного внимания DeepSeek Sparse Attention (DSA) для повышения эффективности обработки данных.

Вход: 34 ₽/MВыход: 51 ₽/M
ТехнологииПрограммирование+2
Читать →
X-aiX-ai19 ноября 2025 г.

xAI: Grok 4.1 Fast

Grok 4.1 Fast — это высокопроизводительная модель от xAI, оптимизированная для работы в режиме агента и сложного вызова инструментов. Благодаря огромному контекстному окну в 2 миллиона токенов, она отлично справляется с глубокими исследованиями и поддержкой клиентов.

Вход: 25 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai19 сентября 2025 г.

xAI: Grok 4 Fast

Grok 4 Fast — это передовая мультимодальная модель от xAI, сочетающая высокую скорость работы с огромным контекстным окном в 2 миллиона токенов. Модель поддерживает режимы с рассуждениями и без, обеспечивая эффективную обработку текста, изображений и файлов.

Вход: 25 ₽/MВыход: 63 ₽/M
ТехнологииПрограммирование+2
Читать →
Baidu12 августа 2025 г.

Baidu: ERNIE 4.5 VL 28B A3B

Baidu ERNIE 4.5 VL — это передовая мультимодальная модель на архитектуре MoE, которая эффективно сочетает глубокое понимание текста и визуальных данных. Благодаря активации всего 3 миллиардов параметров на токен, она обеспечивает высокую скорость работы при сохранении качества ответов уровня флагманских решений.

Вход: 18 ₽/MВыход: 70 ₽/M
ТехнологииНаука+2
Читать →
Tencent08 июля 2025 г.

Tencent: Hunyuan A13B Instruct

Hunyuan-A13B — это эффективная модель на архитектуре MoE от Tencent с 13 миллиардами активных параметров и поддержкой длинного контекста до 128k токенов. Она специализируется на сложных рассуждениях через цепочки мыслей (Chain-of-Thought) и демонстрирует высокую производительность в логических задачах.

Вход: 18 ₽/MВыход: 71 ₽/M
ТехнологииНаука+2
Читать →
DeepseekDeepseek01 декабря 2025 г.

DeepSeek: DeepSeek V3.2 Speciale

DeepSeek V3.2 Speciale — это высокопроизводительная модель, оптимизированная для сложных рассуждений и работы в качестве автономного агента. Благодаря архитектуре Sparse Attention и усиленному обучению с подкреплением, она эффективно справляется с длинными контекстами и многоступенчатыми задачами.

Вход: 36 ₽/MВыход: 54 ₽/M
ПрограммированиеТехнологии+2
Читать →
MistralaiMistralai16 марта 2026 г.

Mistral: Mistral Small 4

Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.

Вход: 19 ₽/MВыход: 75 ₽/M
ПрограммированиеТехнологии+2
Читать →
Upstage27 января 2026 г.

Upstage: Solar Pro 3

Solar Pro 3 — это мощная модель на архитектуре Mixture-of-Experts (MoE) от Upstage, использующая 12 млрд активных параметров из 102 млрд. Она обеспечивает высокую производительность и эффективность, предлагая расширенную поддержку корейского, английского и японского языков.

Вход: 19 ₽/MВыход: 75 ₽/M
ТехнологииПеревод+1
Читать →
Allenai06 января 2026 г.

AllenAI: Olmo 3.1 32B Instruct

Olmo 3.1 32B Instruct — это высокопроизводительная языковая модель с 32 миллиардами параметров, оптимизированная для ведения сложных диалогов и точного следования инструкциям. Благодаря расширенному контекстному окну в 64k токенов, она эффективно справляется с анализом объемных документов и многоэтапными задачами.

Вход: 25 ₽/MВыход: 75 ₽/M
ТехнологииАкадемические задачи+2
Читать →
Nvidia28 октября 2025 г.

NVIDIA: Nemotron Nano 12B 2 VL

Мультимодальная модель от NVIDIA с 12 миллиардами параметров, использующая гибридную архитектуру Transformer-Mamba для эффективного анализа видео и документов. Она обеспечивает высокую точность рассуждений при работе с длинными контекстами до 128k токенов, объединяя сильные стороны двух архитектур.

Вход: 25 ₽/MВыход: 75 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen11 сентября 2025 г.

Qwen: Qwen3 Next 80B A3B Thinking

Qwen3 Next 80B A3B Thinking — это специализированная модель, ориентированная на глубокое логическое рассуждение и решение многошаговых задач. Она автоматически генерирует цепочки размышлений, что делает её идеальной для сложного программирования, математических доказательств и агентских сценариев.

Вход: 13 ₽/MВыход: 97 ₽/M
ПрограммированиеНаука+2
Читать →
QwenQwen04 февраля 2026 г.

Qwen: Qwen3 Coder Next

Qwen3 Coder Next — это специализированная языковая модель с открытыми весами, оптимизированная для задач программирования и локальной разработки. Благодаря архитектуре MoE с 80 миллиардами параметров, из которых активны только 3 миллиарда, она обеспечивает высокую скорость работы при сохранении глубокой экспертизы в кодинге.

Вход: 14 ₽/MВыход: 100 ₽/M
ПрограммированиеТехнологии+1
Читать →
Z-ai25 июля 2025 г.

Z.ai: GLM 4.5 Air

GLM-4.5-Air — это облегченная версия флагманской модели, использующая архитектуру Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Вход: 17 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
Meituan09 сентября 2025 г.

Meituan: LongCat Flash Chat

Meituan: LongCat Flash Chat — это масштабная модель на архитектуре Mixture-of-Experts (MoE) с 560 миллиардами параметров, оптимизированная для быстрой обработки данных. Благодаря инновационной структуре с сокращенными соединениями, она обеспечивает высокую производительность при работе с длинными контекстами до 128k токенов.

Вход: 25 ₽/MВыход: 100 ₽/M
ТехнологииПрограммирование+2
Читать →
Inception04 марта 2026 г.

Inception: Mercury 2

Mercury 2 — это инновационная диффузионная модель (dLLM), обеспечивающая рекордную скорость генерации свыше 1000 токенов в секунду. Она сочетает в себе глубокие рассуждения с параллельной обработкой данных, что делает её в 5 раз быстрее конкурентов при низкой стоимости эксплуатации.

Вход: 32 ₽/MВыход: 94 ₽/M
ПрограммированиеТехнологии+2
Читать →
DeepseekDeepseek21 августа 2025 г.

DeepSeek: DeepSeek V3.1

DeepSeek V3.1 — это мощная гибридная модель с 671 миллиардом параметров, поддерживающая режимы обычного ответа и глубокого рассуждения. Она оптимизирована для работы с длинным контекстом и демонстрирует высокую эффективность в сложных интеллектуальных задачах.

Вход: 27 ₽/MВыход: 99 ₽/M
ПрограммированиеТехнологии+2
Читать →
Inception26 июня 2025 г.

Inception: Mercury

Inception: Mercury — это первая большая языковая модель на базе диффузионного подхода (dLLM), обеспечивающая колоссальный прирост производительности. Благодаря инновационному методу дискретной диффузии, она работает в 5-10 раз быстрее оптимизированных моделей конкурентов при сохранении высокого качества генерации.

Вход: 32 ₽/MВыход: 94 ₽/M
ТехнологииПрограммирование+2
Читать →
Arcee-ai01 апреля 2026 г.

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.

Вход: 28 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen23 сентября 2025 г.

Qwen: Qwen3 VL 235B A22B Instruct

Qwen3 VL 235B A22B Instruct — это мощная мультимодальная модель с открытыми весами, объединяющая продвинутую генерацию текста с глубоким анализом изображений и видео. Благодаря огромному контекстному окну в 262 144 токена, она эффективно справляется с парсингом сложных документов, графиков и длинных видеопоследовательностей.

Вход: 25 ₽/MВыход: 110 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-35B-A3B

Qwen3.5-35B-A3B — это инновационная мультимодальная модель, использующая гибридную архитектуру с линейным вниманием и механизмом Mixture-of-Experts (MoE). Она обеспечивает высокую эффективность инференса и поддерживает обработку текста, изображений и видео в рамках огромного контекстного окна.

Вход: 18 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель от Alibaba Cloud, использующая гибридную архитектуру Mixture-of-Experts для эффективной обработки текста, изображений и видео. Благодаря 35 миллиардам общих параметров и огромному контекстному окну, она обеспечивает высокую точность анализа сложных визуальных и текстовых данных.

Вход: 19 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen17 сентября 2025 г.

Qwen: Qwen3 Coder Flash

Qwen3 Coder Flash — это специализированная модель от Alibaba, оптимизированная для быстрой и автономной разработки программного кода. Благодаря поддержке вызова инструментов и огромному контекстному окну, она эффективно справляется с ролью ИИ-агента для программирования.

Вход: 25 ₽/MВыход: 122 ₽/M
ПрограммированиеТехнологии+1
Читать →
QwenQwen11 сентября 2025 г.

Qwen: Qwen3 Next 80B A3B Instruct

Qwen3 Next 80B A3B Instruct — это высокопроизводительная языковая модель, оптимизированная для быстрой генерации ответов без промежуточных этапов рассуждений. Она отлично справляется с программированием, сложными логическими задачами и многоязычными запросами в рамках огромного контекстного окна.

Вход: 12 ₽/MВыход: 137 ₽/M
ПрограммированиеТехнологии+3
Читать →
Z-ai08 декабря 2025 г.

Z.ai: GLM 4.6V

GLM-4.6V — это мощная мультимодальная модель, специализирующаяся на глубоком анализе визуального контента и работе с длинными контекстами до 128K токенов. Она отлично справляется с распознаванием сложных макетов документов, анализом видео и извлечением данных из смешанных медиа-форматов.

Вход: 38 ₽/MВыход: 112 ₽/M
ТехнологииНаука+2
Читать →
DeepseekDeepseek22 сентября 2025 г.

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek V3.1 Terminus — это обновленная версия модели V3.1, в которой улучшена языковая согласованность и расширены возможности агентов. Модель оптимизирована для решения сложных задач с сохранением высокой производительности и точности ответов.

Вход: 34 ₽/MВыход: 118 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax23 декабря 2025 г.

MiniMax: MiniMax M2.1

MiniMax M2.1 — это компактная и высокопроизводительная модель, специально оптимизированная для написания кода и создания автономных агентов. Несмотря на малый объем активируемых параметров, она демонстрирует выдающиеся результаты в разработке современных приложений и сложных рабочих процессах.

Вход: 37 ₽/MВыход: 118 ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax23 октября 2025 г.

MiniMax: MiniMax M2

MiniMax M2 — это высокоэффективная модель с архитектурой MoE, оптимизированная для написания кода и работы в составе автономных агентов. Благодаря 10 миллиардам активных параметров она обеспечивает высокую скорость генерации при сохранении глубокого логического мышления.

Вход: 32 ₽/MВыход: 125 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax12 февраля 2026 г.

MiniMax: MiniMax M2.5

MiniMax M2.5 — это передовая языковая модель, оптимизированная для офисной продуктивности и сложного программирования. Она демонстрирует выдающиеся результаты в работе с документами Word, Excel и PowerPoint, а также эффективно управляет контекстом при переключении между различными программными средами.

Вход: 19 ₽/MВыход: 143 ₽/M
ПрограммированиеТехнологии+2
Читать →
Prime-intellect27 ноября 2025 г.

Prime Intellect: INTELLECT-3

INTELLECT-3 — это высокопроизводительная модель на 106 миллиардов параметров с архитектурой Mixture-of-Experts, обученная на базе GLM-4.5-Air. Благодаря глубокому обучению с подкреплением (RL), она демонстрирует выдающиеся результаты в математических вычислениях и логических задачах при высокой скорости работы.

Вход: 25 ₽/MВыход: 137 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это высокопроизводительная мультимодальная модель от Alibaba, оптимизированная для мгновенной обработки данных. Она поддерживает работу с текстом, изображениями и видео, предлагая внушительное контекстное окно в 1 миллион токенов для анализа сверхбольших документов.

Вход: 24 ₽/MВыход: 140 ₽/M
ТехнологииПрограммирование+2
Читать →
DeepseekDeepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это масштабная модель на архитектуре Mixture-of-Experts с 1,6 трлн параметров, оптимизированная для сложного логического вывода и программирования. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна обрабатывать огромные массивы данных и длинные цепочки рассуждений.

Вход: 55 ₽/MВыход: 109 ₽/M
ПрограммированиеТехнологии+2
Читать →
Baidu30 июня 2025 г.

Baidu: ERNIE 4.5 300B A47B

ERNIE 4.5 300B A47B — это флагманская языковая модель от Baidu, построенная на архитектуре Mixture-of-Experts (MoE). Она сочетает огромный объем знаний с эффективной генерацией текста, активируя 47 миллиардов параметров для каждого токена.

Вход: 35 ₽/MВыход: 137 ₽/M
ТехнологииПеревод+2
Читать →
Tngtech08 июля 2025 г.

TNG: DeepSeek R1T2 Chimera

TNG: DeepSeek R1T2 Chimera — это продвинутая модель на 671 миллиард параметров, созданная методом слияния экспертных чекпоинтов DeepSeek. Она сочетает в себе возможности логического рассуждения и генерации текста, предлагая внушительное контекстное окно для работы с объемными данными.

Вход: 38 ₽/MВыход: 137 ₽/M
ТехнологииПрограммирование+2
Читать →
OpenaiOpenai17 марта 2026 г.

OpenAI: GPT-5.4 Nano

GPT-5.4 Nano — это самая легкая и экономичная модель в семействе GPT-5.4, оптимизированная для задач с критическими требованиями к скорости. Она поддерживает мультимодальный ввод и идеально подходит для классификации данных, извлечения информации и работы в составе распределенных агентских систем.

Вход: 25 ₽/MВыход: 156 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Minimax18 марта 2026 г.

MiniMax: MiniMax M2.7

MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.

Вход: 35 ₽/MВыход: 150 ₽/M
ПрограммированиеФинансы+2
Читать →
QwenQwen14 октября 2025 г.

Qwen: Qwen3 VL 8B Thinking

Qwen3-VL-8B-Thinking — это специализированная мультимодальная модель с оптимизированным механизмом рассуждений для глубокого анализа визуального контента. Она эффективно справляется с интерпретацией сложных документов, видеопоследовательностей и детализированных сцен благодаря расширенному контекстному окну.

Вход: 15 ₽/MВыход: 170 ₽/M
ТехнологииНаука+2
Читать →
Kwaipilot27 марта 2026 г.

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.

Вход: 38 ₽/MВыход: 150 ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax23 января 2026 г.

MiniMax: MiniMax M2-her

MiniMax M2-her — это специализированная языковая модель, оптимизированная для глубокого ролевого взаимодействия и создания выразительных диалогов. Она отлично удерживает контекст персонажа и демонстрирует высокую последовательность в многоходовых беседах.

Вход: 38 ₽/MВыход: 150 ₽/M
Ролевые сценарииПеревод+1
Читать →
QwenQwen25 июля 2025 г.

Qwen: Qwen3 235B A22B Thinking 2507

Qwen3 235B A22B Thinking — это мощная MoE-модель с открытыми весами, специально оптимизированная для глубоких рассуждений и решения сложных логических задач. Благодаря архитектуре Mixture-of-Experts она эффективно задействует 22 млрд параметров для каждого запроса, обеспечивая высокую точность при работе с длинными контекстами до 128k токенов.

Вход: 19 ₽/MВыход: 186 ₽/M
ПрограммированиеТехнологии+3
Читать →
Perceptron12 мая 2026 г.

Perceptron: Perceptron Mk1

Perceptron Mk1 — это флагманская мультимодальная модель, специализирующаяся на глубоком анализе видеоконтента и визуальном мышлении. Она эффективно объединяет обработку изображений и видео с естественным языком для создания детальных отчетов и логических выводов.

Вход: 19 ₽/MВыход: 187 ₽/M
ТехнологииНаука+1
Читать →
Baidu30 июня 2025 г.

Baidu: ERNIE 4.5 VL 424B A47B

ERNIE 4.5 VL — это мощная мультимодальная модель от Baidu, построенная на архитектуре Mixture-of-Experts (MoE) с 424 миллиардами параметров. Она специально оптимизирована для совместной обработки текста и изображений, обеспечивая высокую точность в сложных визуально-текстовых задачах.

Вход: 53 ₽/MВыход: 156 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen06 октября 2025 г.

Qwen: Qwen3 VL 30B A3B Thinking

Qwen3 VL 30B A3B Thinking — это продвинутая мультимодальная модель, объединяющая глубокое визуальное понимание с мощными механизмами логического вывода. Благодаря функции Thinking, нейросеть демонстрирует исключительные результаты в решении сложных STEM-задач и анализе видеоконтента.

Вход: 17 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai26 августа 2025 г.

xAI: Grok Code Fast 1

Grok Code Fast 1 — это специализированная модель от xAI, оптимизированная для быстрой генерации кода и решения сложных инженерных задач. Благодаря поддержке цепочек рассуждений (reasoning traces), разработчики могут контролировать логику модели для достижения максимального качества в агентных сценариях.

Вход: 25 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+1
Читать →
GoogleGoogle07 мая 2026 г.

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.

Вход: 32 ₽/MВыход: 187 ₽/M
ТехнологииПрограммирование+2
Читать →
GoogleGoogle03 марта 2026 г.

Google: Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для массовых задач с поддержкой мультимодальных данных. Она превосходит версию 2.5 Flash Lite по качеству и предлагает гибкую настройку уровней «мышления» для баланса между стоимостью и производительностью.

Вход: 32 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-27B

Qwen3.5-27B — это производительная мультимодальная модель с линейным механизмом внимания, обеспечивающим высокую скорость отклика. По своим возможностям она сопоставима с более крупной версией 122B, предлагая отличный баланс между эффективностью и качеством обработки визуальных данных.

Вход: 25 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen16 февраля 2026 г.

Qwen: Qwen3.5 Plus 2026-02-15

Qwen3.5 Plus — это передовая мультимодальная модель на гибридной архитектуре, сочетающая линейное внимание и разреженные MoE-слои для высокой эффективности. Она демонстрирует значительный скачок в качестве обработки текста, изображений и видео по сравнению с предыдущим поколением, достигая уровня топовых мировых решений.

Вход: 33 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
Morph07 июля 2025 г.

Morph: Morph V3 Fast

Morph V3 Fast — это специализированная модель для мгновенного применения правок в коде, обеспечивающая скорость обработки до 10 500 токенов в секунду. При точности в 96% она идеально подходит для автоматизации рутинных трансформаций и быстрой итерации программных проектов.

Вход: 96 ₽/MВыход: 144 ₽/M
ПрограммированиеТехнологии+1
Читать →
QwenQwen23 июля 2025 г.

Qwen: Qwen3 Coder 480B A35B

Qwen3 Coder 480B A35B — это мощная MoE-модель, специально оптимизированная для сложных задач программирования и агентного взаимодействия. Благодаря архитектуре смеси экспертов и огромному контекстному окну, она эффективно справляется с вызовом функций и рассуждениями в длинных фрагментах кода.

Вход: 27 ₽/MВыход: 216 ₽/M
ПрограммированиеТехнологии+1
Читать →
МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru