Alltokens

Новости

Новые модели, обновления цен и улучшения возможностей.

Подборки моделей

AnthropicAnthropic12 мая 2026 г.

Anthropic: Claude Opus 4.7 (Fast)

Claude Opus 4.7 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, сочетающая глубокие аналитические способности с увеличенной скоростью генерации. Модель поддерживает работу с огромным контекстом до 1 миллиона токенов и эффективно обрабатывает текст, изображения и файлы.

Вход: 3 312 ₽/MВыход: 16 560 ₽/M
ПрограммированиеТехнологии+3
Читать →
Perceptron12 мая 2026 г.

Perceptron: Perceptron Mk1

Perceptron Mk1 — это флагманская мультимодальная модель, специализирующаяся на глубоком анализе видеоконтента и визуальном мышлении. Она эффективно объединяет обработку изображений и видео с естественным языком для создания детальных отчетов и логических выводов.

Вход: 19 ₽/MВыход: 187 ₽/M
ТехнологииНаука+1
Читать →
Inclusionai08 мая 2026 г.

inclusionAI: Ring-2.6-1T

Ring-2.6-1T — это масштабная модель с архитектурой мышления, оптимизированная для сложных агентных рабочих процессов и написания кода. Благодаря 63 миллиардам активных параметров и внушительному контекстному окну, она обеспечивает высокую эффективность в решении многоступенчатых задач и интеграции с инструментами.

Вход: 10 ₽/MВыход: 78 ₽/M
ПрограммированиеТехнологии+2
Читать →
Inclusionai08 мая 2026 г.

inclusionAI: Ring-2.6-1T (Бесплатно)

Ring-2.6-1T — это масштабная модель с 1 триллионом параметров и 63 миллиардами активных весов, оптимизированная для сложных агентных рабочих процессов. Она демонстрирует высокую эффективность в написании кода и использовании инструментов благодаря продвинутым механизмам рассуждения.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
GoogleGoogle07 мая 2026 г.

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.

Вход: 32 ₽/MВыход: 187 ₽/M
ТехнологииПрограммирование+2
Читать →
Baidu06 мая 2026 г.

Baidu Qianfan: CoBuddy (Бесплатно)

Baidu Qianfan: CoBuddy — это специализированная модель для генерации кода и создания интеллектуальных агентов с поддержкой инструментов. Она отличается высокой пропускной способностью и минимальными задержками при работе с контекстом до 128 тысяч токенов.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
OpenaiOpenai05 мая 2026 г.

OpenAI: GPT Chat Latest

GPT Chat Latest — это актуальная версия флагманской модели от OpenAI, которая автоматически обновляется до самых свежих стабильных релизов. Она поддерживает мультимодальный ввод, включая текст, изображения и файлы, предлагая внушительное контекстное окно в 400 000 токенов.

Вход: 575 ₽/MВыход: 3 450 ₽/M
ТехнологииПрограммирование+3
Читать →
X-aiX-ai30 апреля 2026 г.

xAI: Grok 4.3

Grok 4.3 — это продвинутая мультимодальная модель от xAI, специализирующаяся на сложных рассуждениях и работе с контекстом до 1 миллиона токенов. Она отлично справляется с агентными сценариями, строгим следованием инструкциям и анализом визуальных данных.

Вход: 150 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+3
Читать →
Ibm-granite30 апреля 2026 г.

IBM: Granite 4.1 8B

IBM Granite 4.1 8B — это компактная и эффективная языковая модель, оптимизированная для корпоративных задач и работы с длинными контекстами до 131 тысячи токенов. Она демонстрирует высокую точность в структурировании данных и использовании инструментов, что делает её надежным решением для автоматизации бизнес-процессов.

Вход: 7 ₽/MВыход: 13 ₽/M
ТехнологииФинансы+2
Читать →
MistralaiMistralai30 апреля 2026 г.

Mistral: Mistral Medium 3.5

Mistral Medium 3.5 — это мощная плотная модель на 128 миллиардов параметров, оптимизированная для сложных агентских сценариев и программирования. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки объемных документов.

Вход: 180 ₽/MВыход: 897 ₽/M
ПрограммированиеТехнологии+2
Читать →
Alltokens28 апреля 2026 г.

Owl Alpha

Owl Alpha — это высокопроизводительная базовая модель, специально оптимизированная для работы автономных агентов и автоматизации сложных рабочих процессов. Она обладает внушительным контекстным окном более миллиона токенов, что позволяет эффективно обрабатывать огромные массивы данных и генерировать сложный программный код.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia28 апреля 2026 г.

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

NVIDIA Nemotron 3 Nano Omni — это передовая мультимодальная модель, способная обрабатывать текст, изображения, аудио и видео. Она оптимизирована для работы в качестве интеллектуального агента в корпоративных системах, предлагая глубокое логическое рассуждение и внушительное контекстное окно.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+2
Читать →
Poolside28 апреля 2026 г.

Poolside: Laguna XS.2 (Бесплатно)

Laguna XS.2 — это компактная модель второго поколения от Poolside, специально оптимизированная для задач программирования. Она эффективно сочетает возможности рассуждения и вызова инструментов при сохранении высокой скорости работы и внушительного контекстного окна.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
Poolside28 апреля 2026 г.

Poolside: Laguna M.1 (Бесплатно)

Laguna M.1 — это флагманская модель от Poolside, специально разработанная для решения сложных инженерных задач и написания кода. Она поддерживает агентные рабочие процессы, вызов инструментов и обладает внушительным контекстным окном в 128K токенов.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
~anthropic27 апреля 2026 г.

Anthropic Claude Haiku Latest

Claude Haiku Latest — это самая быстрая и эффективная модель в семействе Anthropic, предназначенная для мгновенной обработки текстовых и визуальных данных. Она сочетает в себе огромное контекстное окно в 200 000 токенов с высокой скоростью генерации, что делает её идеальной для автоматизации рутинных задач.

Вход: 120 ₽/MВыход: 598 ₽/M
ТехнологииПрограммирование+2
Читать →
~openai27 апреля 2026 г.

OpenAI GPT Mini Latest

OpenAI GPT Mini Latest — это актуальная версия компактной модели, оптимизированная для быстрой обработки текста и изображений. Она поддерживает работу с огромным контекстом до 400 000 токенов и структурированный вывод данных через alltokens.

Вход: 90 ₽/MВыход: 539 ₽/M
ТехнологииПрограммирование+2
Читать →
~google27 апреля 2026 г.

Google Gemini Pro Latest

Google Gemini Pro Latest — это универсальная мультимодальная модель, способная обрабатывать текст, изображения, аудио и видео. Благодаря рекордному контекстному окну в 1 миллион токенов, она идеально подходит для анализа огромных массивов данных и длинных документов через alltokens.

Вход: 230 ₽/MВыход: 1 380 ₽/M
ТехнологииПрограммирование+3
Читать →
~moonshotai27 апреля 2026 г.

MoonshotAI Kimi Latest

MoonshotAI Kimi Latest — это флагманская мультимодальная модель, способная обрабатывать как текстовые запросы, так и изображения. Благодаря внушительному контекстному окну в 256 000 токенов, она отлично справляется с анализом объемных документов и сложными логическими задачами.

Вход: 88 ₽/MВыход: 418 ₽/M
ТехнологииАкадемические задачи+2
Читать →
~google27 апреля 2026 г.

Google Gemini Flash Latest

Google Gemini Flash Latest — это высокопроизводительная мультимодальная модель, оптимизированная для быстрой обработки огромных объемов данных. Благодаря рекордному контекстному окну в 1 миллион токенов, она эффективно справляется с анализом длинных документов, видео и аудиофайлов в реальном времени через alltokens.

Вход: 60 ₽/MВыход: 359 ₽/M
ТехнологииПрограммирование+2
Читать →
~anthropic27 апреля 2026 г.

Anthropic Claude Sonnet Latest

Anthropic Claude Sonnet Latest — это актуальная версия сбалансированной модели, сочетающая высокую скорость работы и глубокое понимание контекста. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном для обработки объемных документов и сложных инструкций.

Вход: 345 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+2
Читать →
~openai27 апреля 2026 г.

OpenAI GPT Latest

OpenAI GPT Latest — это динамический идентификатор, который всегда предоставляет доступ к самой актуальной и мощной версии модели семейства GPT. Она поддерживает мультимодальный ввод, включая текст, изображения и файлы, и обладает внушительным контекстным окном для обработки огромных массивов данных.

Вход: 575 ₽/MВыход: 3 450 ₽/M
ПрограммированиеТехнологии+3
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus — это мощная мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря рекордному контекстному окну в 1 миллион токенов, она идеально подходит для анализа сверхдлинных документов и сложных медиафайлов.

Вход: 36 ₽/MВыход: 216 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это высокопроизводительная мультимодальная модель от Alibaba, оптимизированная для мгновенной обработки данных. Она поддерживает работу с текстом, изображениями и видео, предлагая внушительное контекстное окно в 1 миллион токенов для анализа сверхбольших документов.

Вход: 24 ₽/MВыход: 140 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель от Alibaba Cloud, использующая гибридную архитектуру Mixture-of-Experts для эффективной обработки текста, изображений и видео. Благодаря 35 миллиардам общих параметров и огромному контекстному окну, она обеспечивает высокую точность анализа сложных визуальных и текстовых данных.

Вход: 19 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 Max Preview

Qwen3.6 Max Preview — это флагманская модель от Alibaba Cloud, построенная на архитектуре MoE с 1 триллионом параметров. Она демонстрирует выдающиеся способности в агентном программировании, использовании инструментов и обработке сверхдлинных контекстов до 262 тысяч токенов.

Вход: 125 ₽/MВыход: 747 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen27 апреля 2026 г.

Qwen: Qwen3.6 27B

Qwen3.6 27B — это продвинутая мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря внушительному контекстному окну в 262 тысячи токенов, она эффективно справляется с анализом длинных документов и сложных медиафайлов.

Вход: 39 ₽/MВыход: 383 ₽/M
ТехнологииПрограммирование+2
Читать →
OpenaiOpenai24 апреля 2026 г.

OpenAI: GPT-5.5 Pro

GPT-5.5 Pro — это флагманская модель от OpenAI, разработанная для глубокого логического анализа и решения критически важных задач. Благодаря рекордному контекстному окну более 1 миллиона токенов, она способна обрабатывать огромные массивы данных с высокой точностью.

Вход: 3 312 ₽/MВыход: 19 872 ₽/M
ТехнологииНаука+3
Читать →
OpenaiOpenai24 апреля 2026 г.

OpenAI: GPT-5.5

GPT-5.5 представляет собой передовую модель от OpenAI, оптимизированную для решения сложнейших профессиональных задач с повышенной надежностью. Благодаря контекстному окну более 1 миллиона токенов и улучшенным механизмам рассуждения, она эффективно справляется с анализом огромных массивов данных и мультимодальным контентом.

Вход: 575 ₽/MВыход: 3 450 ₽/M
ТехнологииНаука+3
Читать →
DeepseekDeepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это масштабная модель на архитектуре Mixture-of-Experts с 1,6 трлн параметров, оптимизированная для сложного логического вывода и программирования. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна обрабатывать огромные массивы данных и длинные цепочки рассуждений.

Вход: 55 ₽/MВыход: 109 ₽/M
ПрограммированиеТехнологии+2
Читать →
DeepseekDeepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Flash (Бесплатно)

DeepSeek V4 Flash — это высокоэффективная модель с архитектурой Mixture-of-Experts, оптимизированная для сверхбыстрой генерации текста. Благодаря поддержке контекстного окна до 256 000 токенов и 13 миллиардам активных параметров, она обеспечивает баланс между скоростью работы и качеством ответов.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
DeepseekDeepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это высокопроизводительная модель с архитектурой Mixture-of-Experts, оптимизированная для мгновенного отклика. Благодаря поддержке контекстного окна в 1 миллион токенов, она идеально подходит для обработки сверхдлинных документов и сложного анализа данных.

Вход: 14 ₽/MВыход: 28 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inclusionai23 апреля 2026 г.

inclusionAI: Ling-2.6-1T

Ling-2.6-1T — это флагманская модель с триллионом параметров, оптимизированная для работы в качестве быстрого ИИ-агента. Она сочетает в себе огромную вычислительную мощность с высокой скоростью исполнения, что делает её подходящей для масштабных корпоративных задач.

Вход: 36 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+2
Читать →
Inclusionai23 апреля 2026 г.

inclusionAI: Ling-2.6-1T (Бесплатно)

Ling-2.6-1T — это флагманская модель с триллионом параметров, оптимизированная для работы в качестве быстрого ИИ-агента. Она сочетает в себе огромный контекстный предел в 262 тысячи токенов и высокую скорость исполнения для масштабных задач.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Tencent22 апреля 2026 г.

Tencent: Hy3 preview

Tencent Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в агентских сценариях. Она поддерживает гибкую настройку уровней рассуждения, что позволяет адаптировать её под задачи разной сложности в производственных средах.

Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Tencent22 апреля 2026 г.

Tencent: Hy3 preview (Бесплатно)

Tencent: Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в составе ИИ-агентов. Она предлагает гибкую настройку уровней рассуждения и внушительное контекстное окно для обработки сложных производственных задач.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+1
Читать →
Xiaomi22 апреля 2026 г.

Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro — это флагманская модель от Xiaomi, оптимизированная для решения сложных инженерных задач и длительных рабочих циклов. Она демонстрирует выдающиеся результаты в бенчмарках на программирование и автономное выполнение агентских функций.

Вход: 120 ₽/MВыход: 359 ₽/M
ПрограммированиеТехнологии+2
Читать →
Xiaomi22 апреля 2026 г.

Xiaomi: MiMo-V2.5

MiMo-V2.5 — это нативная мультимодальная модель от Xiaomi, обеспечивающая производительность уровня Pro-агентов. Она значительно превосходит предыдущие итерации в понимании изображений и видео, предлагая высокую эффективность при выполнении сложных задач.

Вход: 48 ₽/MВыход: 240 ₽/M
ТехнологииНаука+2
Читать →
OpenaiOpenai21 апреля 2026 г.

OpenAI: GPT-5.4 Image 2

GPT-5.4 Image 2 — это передовая мультимодальная модель, объединяющая глубокое логическое мышление с возможностью генерации высококачественных изображений. Она поддерживает работу с длинными контекстами до 272 000 токенов, обеспечивая бесшовный переход между анализом данных, кодингом и визуализацией.

Вход: 920 ₽/MВыход: 1 725 ₽/M
ТехнологииПрограммирование+2
Читать →
Inclusionai21 апреля 2026 г.

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве автономного агента. Благодаря 7.4 млрд активных параметров она обеспечивает мгновенный отклик и высокую точность при выполнении сложных инструкций.

Вход: 2 ₽/MВыход: 4 ₽/M
ТехнологииПрограммирование+1
Читать →
Inclusionai21 апреля 2026 г.

inclusionAI: Ling-2.6-flash (Бесплатно)

Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве ИИ-агента. Благодаря 262 тысячам контекстного окна и высокой скорости генерации, она отлично справляется с задачами, требующими мгновенного исполнения и обработки длинных документов.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
~anthropic21 апреля 2026 г.

Anthropic: Claude Opus Latest

Claude Opus Latest — это флагманская модель от Anthropic, обеспечивающая высочайший уровень рассуждений и глубокое понимание контекста. Она поддерживает работу с текстом и изображениями, предлагая пользователям alltokens доступ к самым актуальным обновлениям семейства Opus.

Вход: 575 ₽/MВыход: 2 875 ₽/M
ТехнологииПрограммирование+3
Читать →
Alltokens21 апреля 2026 г.

Pareto Code Router

Pareto Code Router — это интеллектуальный инструмент на alltokens, который автоматически выбирает оптимальную модель для программирования на основе заданного порога качества. Он избавляет от необходимости вручную переключаться между нейросетями, гарантируя стабильно высокий результат при написании кода.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
Baidu20 апреля 2026 г.

Baidu: Qianfan-OCR-Fast

Baidu: Qianfan-OCR-Fast — это специализированная мультимодальная модель, оптимизированная для высокоточного распознавания текста с изображений. Она сочетает в себе глубокую экспертизу в OCR с возможностями современных больших языковых моделей для анализа контекста.

Вход: 82 ₽/MВыход: 337 ₽/M
ТехнологииФинансы+2
Читать →
Baidu20 апреля 2026 г.

Baidu: Qianfan-OCR-Fast (Бесплатно)

Qianfan-OCR-Fast — это специализированная мультимодальная модель от Baidu, оптимизированная для высокоскоростного распознавания текста. Она сочетает в себе глубокую экспертизу в OCR с возможностями интеллектуального анализа изображений, предлагая значительный прирост производительности по сравнению с базовыми версиями.

Вход: ₽/MВыход: ₽/M
ТехнологииФинансы+2
Читать →
Moonshotai20 апреля 2026 г.

MoonshotAI: Kimi K2.6

Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, оптимизированная для сложного программирования и создания UI/UX. Она поддерживает контекст до 262 тысяч токенов и эффективно справляется с многоагентной оркестрацией и долгосрочными задачами разработки.

Вход: 88 ₽/MВыход: 418 ₽/M
ПрограммированиеТехнологии+2
Читать →
GoogleGoogle17 апреля 2026 г.

Google: Gemini Embedding 2 Preview

Gemini Embedding 2 Preview — это первая мультимодальная модель эмбеддингов от Google, способная преобразовывать текст, изображения, видео и PDF в единое векторное пространство. Она идеально подходит для создания продвинутых систем семантического поиска и реализации RAG-сценариев с использованием разнородных данных.

Вход: 25 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
AnthropicAnthropic16 апреля 2026 г.

Anthropic: Claude Opus 4.7

Claude Opus 4.7 — это флагманская модель нового поколения, специально оптимизированная для работы автономных агентов и выполнения сложных многоэтапных задач. Благодаря расширенному контекстному окну и улучшенным способностям к программированию, она демонстрирует высочайшую точность в анализе данных и мультимодальных запросах.

Вход: 575 ₽/MВыход: 2 875 ₽/M
ПрограммированиеТехнологии+3
Читать →
Alltokens13 апреля 2026 г.

Elephant

Elephant Alpha — это текстовая модель с 100 миллиардами параметров, ориентированная на высокую эффективность рассуждений и оптимизацию использования токенов. Благодаря контекстному окну в 256K и поддержке структурированного вывода, она отлично справляется с анализом объемных документов и сложными логическими задачами.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+2
Читать →
AnthropicAnthropic07 апреля 2026 г.

Anthropic: Claude Opus 4.6 (Fast)

Claude Opus 4.6 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, предлагающая идентичные возможности при значительно увеличенной скорости генерации. Модель поддерживает контекст до 1 миллиона токенов и эффективно работает с текстом и изображениями.

Вход: 3 312 ₽/MВыход: 16 560 ₽/M
ПрограммированиеТехнологии+3
Читать →
Z-ai07 апреля 2026 г.

Z.ai: GLM 5.1

GLM-5.1 представляет собой значительный скачок в области генерации кода и решения долгосрочных задач. Модель способна работать автономно над сложными проектами, выходя за рамки простых коротких взаимодействий благодаря расширенному контекстному окну.

Вход: 118 ₽/MВыход: 369 ₽/M
ПрограммированиеТехнологии+2
Читать →
GoogleGoogle03 апреля 2026 г.

Google: Gemma 4 26B A4B (Бесплатно)

Gemma 4 26B A4B — это эффективная MoE-модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для достижения высокой производительности при низких затратах ресурсов. Благодаря активации всего 3.8 млрд параметров на токен, она обеспечивает качество ответов уровня 31B-моделей и поддерживает мультимодальный ввод, включая текст, изображения и видео.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle03 апреля 2026 г.

Google: Gemma 4 26B A4B

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Вход: 8 ₽/MВыход: 41 ₽/M
ТехнологииПрограммирование+2
Читать →
GoogleGoogle02 апреля 2026 г.

Google: Gemma 4 31B (Бесплатно)

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, способная обрабатывать текст, изображения и видео. Она выделяется огромным контекстным окном в 256K токенов и поддержкой настраиваемого режима рассуждений для решения сложных логических задач.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle02 апреля 2026 г.

Google: Gemma 4 31B

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.

Вход: 15 ₽/MВыход: 46 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen02 апреля 2026 г.

Qwen: Qwen3.6 Plus

Qwen3.6 Plus — это передовая мультимодальная модель на базе гибридной архитектуры, объединяющей линейное внимание и разреженную структуру MoE. Она поддерживает обработку текста, изображений и видео с впечатляющим контекстным окном в 1 миллион токенов, обеспечивая высокую производительность в сложных задачах.

Вход: 39 ₽/MВыход: 234 ₽/M
ТехнологииПрограммирование+2
Читать →
QwenQwen02 апреля 2026 г.

Qwen: Qwen3.6 Plus (Бесплатно)

Qwen 3.6 Plus — это мощная мультимодальная модель на базе гибридной архитектуры, демонстрирующая выдающиеся результаты в агентном программировании и сложном логическом выводе. Она значительно превосходит предыдущие итерации в создании фронтенд-приложений и решении задач на уровне целых репозиториев.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai01 апреля 2026 г.

Z.ai: GLM 5V Turbo

GLM-5V-Turbo — это первая нативная мультимодальная модель от Z.ai, разработанная специально для работы в качестве ИИ-агента. Она эффективно обрабатывает текст, изображения и видео, демонстрируя высокие результаты в долгосрочном планировании и написании кода на основе визуальных данных.

Вход: 144 ₽/MВыход: 479 ₽/M
ПрограммированиеТехнологии+1
Читать →
Arcee-ai01 апреля 2026 г.

Arcee AI: Trinity Large Thinking (Бесплатно)

Arcee AI: Trinity Large Thinking — это мощная open-source модель, специализирующаяся на сложных рассуждениях и агентских сценариях. Она демонстрирует высокие результаты в тестах PinchBench и отлично справляется с многоэтапными логическими задачами благодаря расширенному контекстному окну.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+2
Читать →
Arcee-ai01 апреля 2026 г.

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.

Вход: 28 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
X-aiX-ai31 марта 2026 г.

xAI: Grok 4.20 Multi-Agent

Grok 4.20 Multi-Agent — это продвинутая мультиагентная система от xAI, предназначенная для глубоких исследований и параллельной обработки сложных задач. Модель способна задействовать до 16 агентов одновременно для координации инструментов и синтеза информации в рамках огромного контекстного окна.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai31 марта 2026 г.

xAI: Grok 4.20

Grok 4.20 — это флагманская модель от xAI, выделяющаяся рекордной скоростью работы и минимальным уровнем галлюцинаций. Она поддерживает контекстное окно до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.

Вход: 150 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+3
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Pro Preview

Lyria 3 Pro Preview — это передовая модель Google для генерации полноценных музыкальных композиций в качестве 48 кГц. Она способна создавать структурированные треки с вокалом и инструменталом на основе текстовых описаний или изображений.

Цена: 10 ₽ за композицию
ТехнологииМаркетинг+1
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Clip Preview

Lyria 3 Clip Preview — это специализированная модель Google для генерации высококачественного стерео-аудио с частотой 48 кГц. Она позволяет создавать короткие музыкальные клипы, лупы и превью на основе текстовых промптов или изображений, обеспечивая структурную связность вокала и инструментов.

Цена: 5 ₽ за клип
ТехнологииМаркетинг+1
Читать →
QwenQwen30 марта 2026 г.

Qwen: Qwen3.6 Plus Preview (Бесплатно)

Qwen 3.6 Plus Preview — это флагманская модель нового поколения с гибридной архитектурой, обеспечивающая высокую эффективность и надежность в агентских задачах. Она значительно превосходит серию 3.5 в логических рассуждениях, фронтенд-разработке и решении сложных комплексных проблем.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
Kwaipilot27 марта 2026 г.

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.

Вход: 38 ₽/MВыход: 150 ₽/M
ПрограммированиеТехнологии+1
Читать →
Rekaai20 марта 2026 г.

Reka Edge

Reka Edge — это высокоэффективная мультимодальная модель на 7 миллиардов параметров, специализирующаяся на глубоком анализе изображений и видео. Она демонстрирует отличные результаты в распознавании объектов и работе в качестве автономного агента с использованием инструментов.

Вход: 13 ₽/MВыход: 13 ₽/M
ТехнологииНаука+1
Читать →
Xiaomi18 марта 2026 г.

Xiaomi: MiMo-V2-Omni

MiMo-V2-Omni от Xiaomi — это передовая мультимодальная модель, способная нативно обрабатывать изображения, видео и аудио в единой архитектуре. Благодаря контекстному окну в 256K и продвинутым агентским навыкам, она эффективно справляется с многошаговым планированием и исполнением кода.

Вход: 48 ₽/MВыход: 240 ₽/M
ТехнологииПрограммирование+2
Читать →
Xiaomi18 марта 2026 г.

Xiaomi: MiMo-V2-Pro

MiMo-V2-Pro — это флагманская модель от Xiaomi с объемом параметров более 1 триллиона и внушительным контекстным окном в 1 миллион токенов. Она специально оптимизирована для работы в качестве «мозга» агентных систем, демонстрируя производительность на уровне топовых мировых решений в бенчмарках PinchBench и ClawBench.

Вход: 120 ₽/MВыход: 359 ₽/M
ТехнологииПрограммирование+2
Читать →
Minimax18 марта 2026 г.

MiniMax: MiniMax M2.7

MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.

Вход: 35 ₽/MВыход: 150 ₽/M
ПрограммированиеФинансы+2
Читать →
OpenaiOpenai17 марта 2026 г.

OpenAI: GPT-5.4 Nano

GPT-5.4 Nano — это самая легкая и экономичная модель в семействе GPT-5.4, оптимизированная для задач с критическими требованиями к скорости. Она поддерживает мультимодальный ввод и идеально подходит для классификации данных, извлечения информации и работы в составе распределенных агентских систем.

Вход: 25 ₽/MВыход: 156 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
OpenaiOpenai17 марта 2026 г.

OpenAI: GPT-5.4 Mini

GPT-5.4 Mini — это высокопроизводительная модель, оптимизированная для быстрой обработки больших объемов данных с поддержкой текста и изображений. Она сочетает в себе продвинутые возможности рассуждения и кодинга с низкой задержкой, что делает её идеальной для масштабируемых производственных решений.

Вход: 90 ₽/MВыход: 539 ₽/M
ПрограммированиеТехнологии+2
Читать →
MistralaiMistralai16 марта 2026 г.

Mistral: Mistral Small 4

Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.

Вход: 19 ₽/MВыход: 75 ₽/M
ПрограммированиеТехнологии+2
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, оптимизированная для плотного поиска информации в веб-масштабах. Благодаря 4 миллиардам параметров она обеспечивает максимальное качество извлечения данных и поддерживает контекст до 32 000 токенов.

Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, специально оптимизированная для плотного поиска информации в веб-масштабах. Обладая 4 миллиардами параметров, она обеспечивает максимальное качество извлечения данных и поддерживает внушительное контекстное окно в 32 000 токенов.

Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Компактная модель встраивания (embeddings) от Perplexity с 0,6 млрд параметров, оптимизированная для быстрого поиска в веб-масштабах. Она обеспечивает низкую задержку при генерации векторов и поддерживает внушительный контекст до 32 000 токенов.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Perplexity: Embed V1 0.6B — это компактная и быстрая модель для создания текстовых эмбеддингов, оптимизированная для плотного поиска в веб-масштабах. При объеме в 0.6 млрд параметров она обеспечивает минимальную задержку при генерации векторов, поддерживая контекст до 32 000 токенов.

Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Z-ai15 марта 2026 г.

Z.ai: GLM 5 Turbo

GLM-5 Turbo от Z.ai — это высокопроизводительная модель, оптимизированная для работы в агентных средах и сценариях OpenClaw. Она демонстрирует исключительную стабильность в длительных рабочих процессах, эффективно справляясь с декомпозицией сложных инструкций и использованием инструментов.

Вход: 144 ₽/MВыход: 479 ₽/M
ТехнологииПрограммирование+1
Читать →
X-aiX-ai12 марта 2026 г.

xAI: Grok 4.20 Multi-Agent Beta

Grok 4.20 Multi-Agent Beta — это инновационная модель от xAI, использующая систему параллельных агентов для глубоких исследований и координации сложных задач. Благодаря поддержке до 16 агентов в режиме высокого уровня рассуждений, она эффективно синтезирует информацию и работает с контекстом до 2 миллионов токенов.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai12 марта 2026 г.

xAI: Grok 4.20 Beta

Grok 4.20 Beta — это новый флагман от xAI, выделяющийся рекордной скоростью работы и минимальным уровнем галлюцинаций. Модель поддерживает контекст до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens11 марта 2026 г.

Hunter Alpha

Hunter Alpha — это передовая интеллектуальная модель, специально разработанная для создания автономных агентов. Она демонстрирует исключительные результаты в долгосрочном планировании и сложном многошаговом рассуждении, обеспечивая высокую точность следования инструкциям.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens11 марта 2026 г.

Healer Alpha

Healer Alpha — это передовая мультимодальная модель, способная обрабатывать визуальные, аудио и текстовые данные. Она разработана для выполнения сложных многошаговых задач и обладает встроенными способностями к рассуждению и действию в реальном мире.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+1
Читать →
Nvidia11 марта 2026 г.

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.

Вход: 12 ₽/MВыход: 56 ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia11 марта 2026 г.

NVIDIA: Nemotron 3 Super (Бесплатно)

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Bytedance-seed10 марта 2026 г.

ByteDance Seed: Seed-2.0-Lite

Seed-2.0-Lite — это сбалансированная модель от ByteDance, оптимизированная для высоконагруженных корпоративных задач с акцентом на экономическую эффективность. Она превосходит предыдущее поколение Seed-1.8, предлагая стабильную работу с длинным контекстом и качественную генерацию структурированных данных.

Вход: 30 ₽/MВыход: 240 ₽/M
ТехнологииМаркетинг+2
Читать →
QwenQwen10 марта 2026 г.

Qwen: Qwen3.5-9B

Qwen3.5-9B — это эффективная мультимодальная модель, объединяющая возможности обработки текста, изображений и видео в компактной архитектуре. Благодаря раннему слиянию токенов и контекстному окну в 262 144 токена, она демонстрирует высокие результаты в логических рассуждениях и программировании.

Вход: 5 ₽/MВыход: 19 ₽/M
ПрограммированиеТехнологии+2
Читать →
OpenaiOpenai05 марта 2026 г.

OpenAI: GPT-5.4 Pro

GPT-5.4 Pro — это флагманская модель от OpenAI с унифицированной архитектурой и продвинутыми способностями к рассуждению. Она обладает внушительным контекстным окном более 1 млн токенов и оптимизирована для решения сложнейших многошаговых задач и агентного программирования.

Вход: 3 312 ₽/MВыход: 19 872 ₽/M
ПрограммированиеТехнологии+3
Читать →
OpenaiOpenai05 марта 2026 г.

OpenAI: GPT-5.4

GPT-5.4 — это передовая мультимодальная модель от OpenAI, объединяющая возможности GPT и Codex с контекстным окном более 1 миллиона токенов. Она оптимизирована для сложного программирования, глубокого анализа документов и выполнения многошаговых рабочих процессов с высокой эффективностью.

Вход: 288 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inception04 марта 2026 г.

Inception: Mercury 2

Mercury 2 — это инновационная диффузионная модель (dLLM), обеспечивающая рекордную скорость генерации свыше 1000 токенов в секунду. Она сочетает в себе глубокие рассуждения с параллельной обработкой данных, что делает её в 5 раз быстрее конкурентов при низкой стоимости эксплуатации.

Вход: 32 ₽/MВыход: 94 ₽/M
ПрограммированиеТехнологии+2
Читать →
OpenaiOpenai03 марта 2026 г.

OpenAI: GPT-5.3 Chat

GPT-5.3 Chat — это обновленная версия популярной модели, ориентированная на естественное общение и высокую точность ответов. Она значительно реже выдает необоснованные отказы и лишние предостережения, обеспечивая плавный и контекстуально точный диалог.

Вход: 202 ₽/MВыход: 1 610 ₽/M
ТехнологииМаркетинг+2
Читать →
GoogleGoogle03 марта 2026 г.

Google: Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для массовых задач с поддержкой мультимодальных данных. Она превосходит версию 2.5 Flash Lite по качеству и предлагает гибкую настройку уровней «мышления» для баланса между стоимостью и производительностью.

Вход: 32 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+2
Читать →
Bytedance-seed26 февраля 2026 г.

ByteDance Seed: Seed-2.0-Mini

Seed-2.0-Mini — это легковесная мультимодальная модель от ByteDance, оптимизированная для задач с высокой нагрузкой и жесткими требованиями к скорости ответа. Она поддерживает контекст до 256k токенов и предлагает четыре режима сложности рассуждений для гибкого управления ресурсами.

Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
GoogleGoogle26 февраля 2026 г.

Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview)

Gemini 3.1 Flash Image Preview (Nano Banana 2) — это передовая модель Google для генерации и редактирования изображений, сочетающая качество уровня Pro с высокой скоростью работы. Она обеспечивает глубокое понимание контекста и позволяет гибко настраивать соотношение сторон через API, оставаясь при этом экономически эффективным решением.

Вход: 60 ₽/MВыход: 359 ₽/M
ТехнологииМаркетинг+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-35B-A3B

Qwen3.5-35B-A3B — это инновационная мультимодальная модель, использующая гибридную архитектуру с линейным вниманием и механизмом Mixture-of-Experts (MoE). Она обеспечивает высокую эффективность инференса и поддерживает обработку текста, изображений и видео в рамках огромного контекстного окна.

Вход: 18 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-27B

Qwen3.5-27B — это производительная мультимодальная модель с линейным механизмом внимания, обеспечивающим высокую скорость отклика. По своим возможностям она сопоставима с более крупной версией 122B, предлагая отличный баланс между эффективностью и качеством обработки визуальных данных.

Вход: 25 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-122B-A10B

Qwen3.5-122B-A10B — это продвинутая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE, обеспечивающая высокую эффективность инференса. Она превосходит предыдущие флагманы Qwen3 по текстовым и визуальным возможностям, занимая второе место в линейке по общей производительности.

Вход: 32 ₽/MВыход: 249 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-Flash

Qwen3.5-Flash — это быстрая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE. Она обеспечивает мгновенный отклик при работе с текстом, изображениями и видео, поддерживая контекст до 1 миллиона токенов.

Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Liquid25 февраля 2026 г.

LiquidAI: LFM2-24B-A2B

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Вход: 4 ₽/MВыход: 15 ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle25 февраля 2026 г.

Google: Gemini 3.1 Pro Preview Custom Tools

Специализированная версия Gemini 3.1 Pro с оптимизированным механизмом вызова функций и инструментов. Модель эффективнее выбирает пользовательские инструменты вместо стандартных bash-команд, сохраняя при этом мультимодальность и контекстное окно в 1 млн токенов.

Вход: 230 ₽/MВыход: 1 380 ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia25 февраля 2026 г.

NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

NVIDIA Llama Nemotron Embed VL 1B V2 — это специализированная мультимодальная модель для создания эмбеддингов, оптимизированная для поиска ответов на вопросы. Она способна обрабатывать текст, изображения или их комбинации, эффективно работая с таблицами, графиками и инфографикой.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+1
Читать →
OpenaiOpenai24 февраля 2026 г.

OpenAI: GPT-5.3-Codex

GPT-5.3-Codex — это передовая агентная модель OpenAI, оптимизированная для сложной разработки ПО и взаимодействия с компьютерными интерфейсами. Она демонстрирует рекордные результаты в тестах SWE-Bench Pro и обладает улучшенными навыками работы с терминалом и кибербезопасностью.

Вход: 202 ₽/MВыход: 1 610 ₽/M
ПрограммированиеТехнологии+3
Читать →
Aion-labs23 февраля 2026 г.

AionLabs: Aion-2.0

Aion-2.0 — это специализированная версия DeepSeek V3.2, созданная для глубокого погружения в ролевые игры и сторителлинг. Модель мастерски создает напряжение и конфликты, обеспечивая высокую вовлеченность в повествование даже при работе со сложными и мрачными темами.

Вход: 96 ₽/MВыход: 192 ₽/M
Ролевые сценарииТехнологии+1
Читать →
GoogleGoogle19 февраля 2026 г.

Google: Gemini 3.1 Pro Preview

Gemini 3.1 Pro Preview — это передовая мультимодальная модель от Google с контекстным окном в 1 миллион токенов, оптимизированная для сложного программирования и автономных агентов. Она демонстрирует значительный прогресс в рассуждениях, финансовом моделировании и автоматизации рабочих процессов с использованием инструментов.

Вход: 230 ₽/MВыход: 1 380 ₽/M
ПрограммированиеФинансы+3
Читать →
AnthropicAnthropic17 февраля 2026 г.

Anthropic: Claude Sonnet 4.6

Claude Sonnet 4.6 — это передовая модель от Anthropic, демонстрирующая флагманскую производительность в программировании и управлении сложными проектами. Она обладает уникальными способностями к автоматизации рабочих процессов через управление компьютером и создание качественного контента.

Вход: 345 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen16 февраля 2026 г.

Qwen: Qwen3.5 Plus 2026-02-15

Qwen3.5 Plus — это передовая мультимодальная модель на гибридной архитектуре, сочетающая линейное внимание и разреженные MoE-слои для высокой эффективности. Она демонстрирует значительный скачок в качестве обработки текста, изображений и видео по сравнению с предыдущим поколением, достигая уровня топовых мировых решений.

Вход: 33 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen16 февраля 2026 г.

Qwen: Qwen3.5 397B A17B

Qwen3.5 397B A17B — это мощная мультимодальная модель на базе гибридной архитектуры MoE и линейного внимания, обеспечивающая высокую эффективность инференса. Она демонстрирует передовые результаты в логическом мышлении, генерации кода и анализе видеоконтента.

Вход: 47 ₽/MВыход: 280 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax12 февраля 2026 г.

MiniMax: MiniMax M2.5 (Бесплатно)

MiniMax M2.5 — это передовая языковая модель, оптимизированная для реальных рабочих задач и офисной продуктивности. Она демонстрирует выдающиеся результаты в программировании и автоматизации работы с документами Word, Excel и PowerPoint, эффективно планируя свои действия.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax12 февраля 2026 г.

MiniMax: MiniMax M2.5

MiniMax M2.5 — это передовая языковая модель, оптимизированная для офисной продуктивности и сложного программирования. Она демонстрирует выдающиеся результаты в работе с документами Word, Excel и PowerPoint, а также эффективно управляет контекстом при переключении между различными программными средами.

Вход: 19 ₽/MВыход: 143 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai11 февраля 2026 г.

Z.ai: GLM 5

GLM-5 от Z.ai — это флагманская open-source модель, специально разработанная для проектирования сложных систем и длительных агентных рабочих процессов. Она ориентирована на экспертную разработку ПО, предлагая возможности автономного планирования и глубокого логического обоснования бэкенд-задач.

Вход: 72 ₽/MВыход: 230 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen09 февраля 2026 г.

Qwen: Qwen3 Max Thinking

Qwen3 Max Thinking — это флагманская модель с продвинутыми возможностями рассуждения, предназначенная для решения сложнейших когнитивных задач. Благодаря масштабированию вычислительных мощностей и обучению с подкреплением, она демонстрирует высокую точность в многошаговых логических цепочках.

Вход: 94 ₽/MВыход: 467 ₽/M
ТехнологииНаука+2
Читать →
AnthropicAnthropic04 февраля 2026 г.

Anthropic: Claude Opus 4.6

Claude Opus 4.6 — это самая мощная модель от Anthropic, оптимизированная для сложного программирования и длительных профессиональных задач. Она специально разработана для работы в качестве агента, способного управлять целыми рабочими процессами и анализировать огромные объемы данных благодаря контекстному окну в 1 миллион токенов.

Вход: 575 ₽/MВыход: 2 875 ₽/M
ПрограммированиеТехнологии+3
Читать →
QwenQwen04 февраля 2026 г.

Qwen: Qwen3 Coder Next

Qwen3 Coder Next — это специализированная языковая модель с открытыми весами, оптимизированная для задач программирования и локальной разработки. Благодаря архитектуре MoE с 80 миллиардами параметров, из которых активны только 3 миллиарда, она обеспечивает высокую скорость работы при сохранении глубокой экспертизы в кодинге.

Вход: 14 ₽/MВыход: 100 ₽/M
ПрограммированиеТехнологии+1
Читать →
Alltokens01 февраля 2026 г.

Free Models Router

Универсальный роутер, который автоматически подбирает доступные бесплатные модели для обработки текстовых и визуальных запросов. Система интеллектуально фильтрует варианты, обеспечивая стабильную работу и поддержку широкого спектра параметров генерации.

Вход: ₽/MВыход: ₽/M
ТехнологииФакты и викторины+1
Читать →
Stepfun29 января 2026 г.

StepFun: Step 3.5 Flash

Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации всего 11 миллиардов параметров из 196 миллиардов, она обеспечивает мгновенные ответы и поддерживает внушительное контекстное окно в 256 тысяч токенов.

Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Stepfun29 января 2026 г.

StepFun: Step 3.5 Flash (Бесплатно)

Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации лишь малой части параметров для каждого токена, она обеспечивает мгновенные ответы при сохранении глубокого понимания контекста до 256 тысяч токенов.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Arcee-ai27 января 2026 г.

Arcee AI: Trinity Large Preview

Arcee AI Trinity Large Preview — это масштабная модель с архитектурой Mixture-of-Experts (MoE), использующая 400 миллиардов параметров при высокой эффективности работы. Она демонстрирует выдающиеся результаты в креативном письме и сложных аналитических задачах благодаря продвинутой системе маршрутизации экспертов.

Вход: 19 ₽/MВыход: 56 ₽/M
ТехнологииНаука+2
Читать →
Arcee-ai27 января 2026 г.

Arcee AI: Trinity Large Preview (Бесплатно)

Arcee AI: Trinity Large Preview — это масштабная модель с архитектурой Mixture-of-Experts, использующая 400 миллиардов параметров для глубокого понимания контекста. Она демонстрирует выдающиеся результаты в творческом письме и сложных аналитических задачах благодаря эффективной маршрутизации экспертов.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+1
Читать →
Moonshotai27 января 2026 г.

MoonshotAI: Kimi K2.5

Kimi K2.5 — это передовая мультимодальная модель от Moonshot AI, обученная на колоссальном массиве данных в 15 триллионов токенов. Она выделяется исключительными способностями к визуальному программированию и поддержкой парадигмы автономных агентских систем.

Вход: 48 ₽/MВыход: 228 ₽/M
ПрограммированиеТехнологии+2
Читать →
Upstage27 января 2026 г.

Upstage: Solar Pro 3

Solar Pro 3 — это мощная модель на архитектуре Mixture-of-Experts (MoE) от Upstage, использующая 12 млрд активных параметров из 102 млрд. Она обеспечивает высокую производительность и эффективность, предлагая расширенную поддержку корейского, английского и японского языков.

Вход: 19 ₽/MВыход: 75 ₽/M
ТехнологииПеревод+1
Читать →
Minimax23 января 2026 г.

MiniMax: MiniMax M2-her

MiniMax M2-her — это специализированная языковая модель, оптимизированная для глубокого ролевого взаимодействия и создания выразительных диалогов. Она отлично удерживает контекст персонажа и демонстрирует высокую последовательность в многоходовых беседах.

Вход: 38 ₽/MВыход: 150 ₽/M
Ролевые сценарииПеревод+1
Читать →
Writer21 января 2026 г.

Writer: Palmyra X5

Palmyra X5 — это передовая модель от Writer, специально разработанная для создания и масштабирования ИИ-агентов в корпоративной среде. Она отличается высокой скоростью работы и поддержкой огромного контекстного окна до 1 миллиона токенов, что позволяет обрабатывать массивные объемы данных.

Вход: 72 ₽/MВыход: 718 ₽/M
ТехнологииМаркетинг+2
Читать →
МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru