Anthropic12 мая 2026 г.Anthropic: Claude Opus 4.7 (Fast)
Claude Opus 4.7 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, сочетающая глубокие аналитические способности с увеличенной скоростью генерации. Модель поддерживает работу с огромным контекстом до 1 миллиона токенов и эффективно обрабатывает текст, изображения и файлы.
Вход: 3 312 ₽/MВыход: 16 560 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inclusionai08 мая 2026 г.
inclusionAI: Ring-2.6-1T (Бесплатно)
Ring-2.6-1T — это масштабная модель с 1 триллионом параметров и 63 миллиардами активных весов, оптимизированная для сложных агентных рабочих процессов. Она демонстрирует высокую эффективность в написании кода и использовании инструментов благодаря продвинутым механизмам рассуждения.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+2
Читать →
Google07 мая 2026 г.Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.
Вход: 32 ₽/MВыход: 187 ₽/M
ТехнологииПрограммирование+2
Читать →
Baidu06 мая 2026 г.
Baidu Qianfan: CoBuddy (Бесплатно)
Baidu Qianfan: CoBuddy — это специализированная модель для генерации кода и создания интеллектуальных агентов с поддержкой инструментов. Она отличается высокой пропускной способностью и минимальными задержками при работе с контекстом до 128 тысяч токенов.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
Openai05 мая 2026 г.OpenAI: GPT Chat Latest
GPT Chat Latest — это актуальная версия флагманской модели от OpenAI, которая автоматически обновляется до самых свежих стабильных релизов. Она поддерживает мультимодальный ввод, включая текст, изображения и файлы, предлагая внушительное контекстное окно в 400 000 токенов.
Вход: 575 ₽/MВыход: 3 450 ₽/M
ТехнологииПрограммирование+3
Читать →
X-ai30 апреля 2026 г.xAI: Grok 4.3
Grok 4.3 — это продвинутая мультимодальная модель от xAI, специализирующаяся на сложных рассуждениях и работе с контекстом до 1 миллиона токенов. Она отлично справляется с агентными сценариями, строгим следованием инструкциям и анализом визуальных данных.
Вход: 150 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+3
Читать →
Ibm-granite30 апреля 2026 г.
IBM: Granite 4.1 8B
IBM Granite 4.1 8B — это компактная и эффективная языковая модель, оптимизированная для корпоративных задач и работы с длинными контекстами до 131 тысячи токенов. Она демонстрирует высокую точность в структурировании данных и использовании инструментов, что делает её надежным решением для автоматизации бизнес-процессов.
Вход: 7 ₽/MВыход: 13 ₽/M
ТехнологииФинансы+2
Читать →
Mistralai30 апреля 2026 г.Mistral: Mistral Medium 3.5
Mistral Medium 3.5 — это мощная плотная модель на 128 миллиардов параметров, оптимизированная для сложных агентских сценариев и программирования. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки объемных документов.
Вход: 180 ₽/MВыход: 897 ₽/M
ПрограммированиеТехнологии+2
Читать →
Alltokens28 апреля 2026 г.
Owl Alpha
Owl Alpha — это высокопроизводительная базовая модель, специально оптимизированная для работы автономных агентов и автоматизации сложных рабочих процессов. Она обладает внушительным контекстным окном более миллиона токенов, что позволяет эффективно обрабатывать огромные массивы данных и генерировать сложный программный код.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+2
Читать →
Poolside28 апреля 2026 г.
Poolside: Laguna XS.2 (Бесплатно)
Laguna XS.2 — это компактная модель второго поколения от Poolside, специально оптимизированная для задач программирования. Она эффективно сочетает возможности рассуждения и вызова инструментов при сохранении высокой скорости работы и внушительного контекстного окна.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
Poolside28 апреля 2026 г.
Poolside: Laguna M.1 (Бесплатно)
Laguna M.1 — это флагманская модель от Poolside, специально разработанная для решения сложных инженерных задач и написания кода. Она поддерживает агентные рабочие процессы, вызов инструментов и обладает внушительным контекстным окном в 128K токенов.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
~anthropic27 апреля 2026 г.
Anthropic Claude Haiku Latest
Claude Haiku Latest — это самая быстрая и эффективная модель в семействе Anthropic, предназначенная для мгновенной обработки текстовых и визуальных данных. Она сочетает в себе огромное контекстное окно в 200 000 токенов с высокой скоростью генерации, что делает её идеальной для автоматизации рутинных задач.
Вход: 120 ₽/MВыход: 598 ₽/M
ТехнологииПрограммирование+2
Читать →
~openai27 апреля 2026 г.
OpenAI GPT Mini Latest
OpenAI GPT Mini Latest — это актуальная версия компактной модели, оптимизированная для быстрой обработки текста и изображений. Она поддерживает работу с огромным контекстом до 400 000 токенов и структурированный вывод данных через alltokens.
Вход: 90 ₽/MВыход: 539 ₽/M
ТехнологииПрограммирование+2
Читать →
~google27 апреля 2026 г.
Google Gemini Pro Latest
Google Gemini Pro Latest — это универсальная мультимодальная модель, способная обрабатывать текст, изображения, аудио и видео. Благодаря рекордному контекстному окну в 1 миллион токенов, она идеально подходит для анализа огромных массивов данных и длинных документов через alltokens.
Вход: 230 ₽/MВыход: 1 380 ₽/M
ТехнологииПрограммирование+3
Читать →
~moonshotai27 апреля 2026 г.
MoonshotAI Kimi Latest
MoonshotAI Kimi Latest — это флагманская мультимодальная модель, способная обрабатывать как текстовые запросы, так и изображения. Благодаря внушительному контекстному окну в 256 000 токенов, она отлично справляется с анализом объемных документов и сложными логическими задачами.
Вход: 88 ₽/MВыход: 418 ₽/M
ТехнологииАкадемические задачи+2
Читать →
~google27 апреля 2026 г.
Google Gemini Flash Latest
Google Gemini Flash Latest — это высокопроизводительная мультимодальная модель, оптимизированная для быстрой обработки огромных объемов данных. Благодаря рекордному контекстному окну в 1 миллион токенов, она эффективно справляется с анализом длинных документов, видео и аудиофайлов в реальном времени через alltokens.
Вход: 60 ₽/MВыход: 359 ₽/M
ТехнологииПрограммирование+2
Читать →
~anthropic27 апреля 2026 г.
Anthropic Claude Sonnet Latest
Anthropic Claude Sonnet Latest — это актуальная версия сбалансированной модели, сочетающая высокую скорость работы и глубокое понимание контекста. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном для обработки объемных документов и сложных инструкций.
Вход: 345 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+2
Читать →
~openai27 апреля 2026 г.
OpenAI GPT Latest
OpenAI GPT Latest — это динамический идентификатор, который всегда предоставляет доступ к самой актуальной и мощной версии модели семейства GPT. Она поддерживает мультимодальный ввод, включая текст, изображения и файлы, и обладает внушительным контекстным окном для обработки огромных массивов данных.
Вход: 575 ₽/MВыход: 3 450 ₽/M
ПрограммированиеТехнологии+3
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.5 Plus 2026-04-20
Qwen3.5 Plus — это мощная мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря рекордному контекстному окну в 1 миллион токенов, она идеально подходит для анализа сверхдлинных документов и сложных медиафайлов.
Вход: 36 ₽/MВыход: 216 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.6 Flash
Qwen3.6 Flash — это высокопроизводительная мультимодальная модель от Alibaba, оптимизированная для мгновенной обработки данных. Она поддерживает работу с текстом, изображениями и видео, предлагая внушительное контекстное окно в 1 миллион токенов для анализа сверхбольших документов.
Вход: 24 ₽/MВыход: 140 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.6 Max Preview
Qwen3.6 Max Preview — это флагманская модель от Alibaba Cloud, построенная на архитектуре MoE с 1 триллионом параметров. Она демонстрирует выдающиеся способности в агентном программировании, использовании инструментов и обработке сверхдлинных контекстов до 262 тысяч токенов.
Вход: 125 ₽/MВыход: 747 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.6 27B
Qwen3.6 27B — это продвинутая мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря внушительному контекстному окну в 262 тысячи токенов, она эффективно справляется с анализом длинных документов и сложных медиафайлов.
Вход: 39 ₽/MВыход: 383 ₽/M
ТехнологииПрограммирование+2
Читать →
Openai24 апреля 2026 г.OpenAI: GPT-5.5 Pro
GPT-5.5 Pro — это флагманская модель от OpenAI, разработанная для глубокого логического анализа и решения критически важных задач. Благодаря рекордному контекстному окну более 1 миллиона токенов, она способна обрабатывать огромные массивы данных с высокой точностью.
Вход: 3 312 ₽/MВыход: 19 872 ₽/M
ТехнологииНаука+3
Читать →
Openai24 апреля 2026 г.OpenAI: GPT-5.5
GPT-5.5 представляет собой передовую модель от OpenAI, оптимизированную для решения сложнейших профессиональных задач с повышенной надежностью. Благодаря контекстному окну более 1 миллиона токенов и улучшенным механизмам рассуждения, она эффективно справляется с анализом огромных массивов данных и мультимодальным контентом.
Вход: 575 ₽/MВыход: 3 450 ₽/M
ТехнологииНаука+3
Читать →
Deepseek24 апреля 2026 г.DeepSeek: DeepSeek V4 Pro
DeepSeek V4 Pro — это масштабная модель на архитектуре Mixture-of-Experts с 1,6 трлн параметров, оптимизированная для сложного логического вывода и программирования. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна обрабатывать огромные массивы данных и длинные цепочки рассуждений.
Вход: 55 ₽/MВыход: 109 ₽/M
ПрограммированиеТехнологии+2
Читать →
Deepseek24 апреля 2026 г.DeepSeek: DeepSeek V4 Flash (Бесплатно)
DeepSeek V4 Flash — это высокоэффективная модель с архитектурой Mixture-of-Experts, оптимизированная для сверхбыстрой генерации текста. Благодаря поддержке контекстного окна до 256 000 токенов и 13 миллиардам активных параметров, она обеспечивает баланс между скоростью работы и качеством ответов.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Deepseek24 апреля 2026 г.DeepSeek: DeepSeek V4 Flash
DeepSeek V4 Flash — это высокопроизводительная модель с архитектурой Mixture-of-Experts, оптимизированная для мгновенного отклика. Благодаря поддержке контекстного окна в 1 миллион токенов, она идеально подходит для обработки сверхдлинных документов и сложного анализа данных.
Вход: 16 ₽/MВыход: 32 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inclusionai23 апреля 2026 г.
inclusionAI: Ling-2.6-1T
Ling-2.6-1T — это флагманская модель с триллионом параметров, оптимизированная для работы в качестве быстрого ИИ-агента. Она сочетает в себе огромную вычислительную мощность с высокой скоростью исполнения, что делает её подходящей для масштабных корпоративных задач.
Вход: 36 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+2
Читать →
Inclusionai23 апреля 2026 г.
inclusionAI: Ling-2.6-1T (Бесплатно)
Ling-2.6-1T — это флагманская модель с триллионом параметров, оптимизированная для работы в качестве быстрого ИИ-агента. Она сочетает в себе огромный контекстный предел в 262 тысячи токенов и высокую скорость исполнения для масштабных задач.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Tencent22 апреля 2026 г.
Tencent: Hy3 preview
Tencent Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в агентских сценариях. Она поддерживает гибкую настройку уровней рассуждения, что позволяет адаптировать её под задачи разной сложности в производственных средах.
Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Tencent22 апреля 2026 г.
Tencent: Hy3 preview (Бесплатно)
Tencent: Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в составе ИИ-агентов. Она предлагает гибкую настройку уровней рассуждения и внушительное контекстное окно для обработки сложных производственных задач.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+1
Читать →
Xiaomi22 апреля 2026 г.
Xiaomi: MiMo-V2.5-Pro
MiMo-V2.5-Pro — это флагманская модель от Xiaomi, оптимизированная для решения сложных инженерных задач и длительных рабочих циклов. Она демонстрирует выдающиеся результаты в бенчмарках на программирование и автономное выполнение агентских функций.
Вход: 120 ₽/MВыход: 359 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai21 апреля 2026 г.OpenAI: GPT-5.4 Image 2
GPT-5.4 Image 2 — это передовая мультимодальная модель, объединяющая глубокое логическое мышление с возможностью генерации высококачественных изображений. Она поддерживает работу с длинными контекстами до 272 000 токенов, обеспечивая бесшовный переход между анализом данных, кодингом и визуализацией.
Вход: 920 ₽/MВыход: 1 725 ₽/M
ТехнологииПрограммирование+2
Читать →
Inclusionai21 апреля 2026 г.
inclusionAI: Ling-2.6-flash
Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве автономного агента. Благодаря 7.4 млрд активных параметров она обеспечивает мгновенный отклик и высокую точность при выполнении сложных инструкций.
Вход: 2 ₽/MВыход: 4 ₽/M
ТехнологииПрограммирование+1
Читать →
Inclusionai21 апреля 2026 г.
inclusionAI: Ling-2.6-flash (Бесплатно)
Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве ИИ-агента. Благодаря 262 тысячам контекстного окна и высокой скорости генерации, она отлично справляется с задачами, требующими мгновенного исполнения и обработки длинных документов.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
~anthropic21 апреля 2026 г.
Anthropic: Claude Opus Latest
Claude Opus Latest — это флагманская модель от Anthropic, обеспечивающая высочайший уровень рассуждений и глубокое понимание контекста. Она поддерживает работу с текстом и изображениями, предлагая пользователям alltokens доступ к самым актуальным обновлениям семейства Opus.
Вход: 575 ₽/MВыход: 2 875 ₽/M
ТехнологииПрограммирование+3
Читать →
Alltokens21 апреля 2026 г.
Pareto Code Router
Pareto Code Router — это интеллектуальный инструмент на alltokens, который автоматически выбирает оптимальную модель для программирования на основе заданного порога качества. Он избавляет от необходимости вручную переключаться между нейросетями, гарантируя стабильно высокий результат при написании кода.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
Moonshotai20 апреля 2026 г.
MoonshotAI: Kimi K2.6
Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, оптимизированная для сложного программирования и создания UI/UX. Она поддерживает контекст до 262 тысяч токенов и эффективно справляется с многоагентной оркестрацией и долгосрочными задачами разработки.
Вход: 88 ₽/MВыход: 418 ₽/M
ПрограммированиеТехнологии+2
Читать →
Anthropic16 апреля 2026 г.Anthropic: Claude Opus 4.7
Claude Opus 4.7 — это флагманская модель нового поколения, специально оптимизированная для работы автономных агентов и выполнения сложных многоэтапных задач. Благодаря расширенному контекстному окну и улучшенным способностям к программированию, она демонстрирует высочайшую точность в анализе данных и мультимодальных запросах.
Вход: 575 ₽/MВыход: 2 875 ₽/M
ПрограммированиеТехнологии+3
Читать →
Anthropic07 апреля 2026 г.Anthropic: Claude Opus 4.6 (Fast)
Claude Opus 4.6 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, предлагающая идентичные возможности при значительно увеличенной скорости генерации. Модель поддерживает контекст до 1 миллиона токенов и эффективно работает с текстом и изображениями.
Вход: 3 312 ₽/MВыход: 16 560 ₽/M
ПрограммированиеТехнологии+3
Читать →
Z-ai07 апреля 2026 г.
Z.ai: GLM 5.1
GLM-5.1 представляет собой значительный скачок в области генерации кода и решения долгосрочных задач. Модель способна работать автономно над сложными проектами, выходя за рамки простых коротких взаимодействий благодаря расширенному контекстному окну.
Вход: 118 ₽/MВыход: 369 ₽/M
ПрограммированиеТехнологии+2
Читать →
Google03 апреля 2026 г.Google: Gemma 4 26B A4B (Бесплатно)
Gemma 4 26B A4B — это эффективная MoE-модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для достижения высокой производительности при низких затратах ресурсов. Благодаря активации всего 3.8 млрд параметров на токен, она обеспечивает качество ответов уровня 31B-моделей и поддерживает мультимодальный ввод, включая текст, изображения и видео.
Вход: — ₽/MВыход: — ₽/M
ТехнологииНаука+2
Читать →
Google03 апреля 2026 г.Google: Gemma 4 26B A4B
Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.
Вход: 8 ₽/MВыход: 41 ₽/M
ТехнологииПрограммирование+2
Читать →
Google02 апреля 2026 г.Google: Gemma 4 31B (Бесплатно)
Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, способная обрабатывать текст, изображения и видео. Она выделяется огромным контекстным окном в 256K токенов и поддержкой настраиваемого режима рассуждений для решения сложных логических задач.
Вход: — ₽/MВыход: — ₽/M
ТехнологииНаука+2
Читать →
Google02 апреля 2026 г.Google: Gemma 4 31B
Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.
Вход: 15 ₽/MВыход: 46 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen02 апреля 2026 г.Qwen: Qwen3.6 Plus
Qwen3.6 Plus — это передовая мультимодальная модель на базе гибридной архитектуры, объединяющей линейное внимание и разреженную структуру MoE. Она поддерживает обработку текста, изображений и видео с впечатляющим контекстным окном в 1 миллион токенов, обеспечивая высокую производительность в сложных задачах.
Вход: 39 ₽/MВыход: 234 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen02 апреля 2026 г.Qwen: Qwen3.6 Plus (Бесплатно)
Qwen 3.6 Plus — это мощная мультимодальная модель на базе гибридной архитектуры, демонстрирующая выдающиеся результаты в агентном программировании и сложном логическом выводе. Она значительно превосходит предыдущие итерации в создании фронтенд-приложений и решении задач на уровне целых репозиториев.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai01 апреля 2026 г.
Z.ai: GLM 5V Turbo
GLM-5V-Turbo — это первая нативная мультимодальная модель от Z.ai, разработанная специально для работы в качестве ИИ-агента. Она эффективно обрабатывает текст, изображения и видео, демонстрируя высокие результаты в долгосрочном планировании и написании кода на основе визуальных данных.
Вход: 144 ₽/MВыход: 479 ₽/M
ПрограммированиеТехнологии+1
Читать →
Arcee-ai01 апреля 2026 г.
Arcee AI: Trinity Large Thinking (Бесплатно)
Arcee AI: Trinity Large Thinking — это мощная open-source модель, специализирующаяся на сложных рассуждениях и агентских сценариях. Она демонстрирует высокие результаты в тестах PinchBench и отлично справляется с многоэтапными логическими задачами благодаря расширенному контекстному окну.
Вход: — ₽/MВыход: — ₽/M
ТехнологииНаука+2
Читать →
Arcee-ai01 апреля 2026 г.
Arcee AI: Trinity Large Thinking
Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.
Вход: 28 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
X-ai31 марта 2026 г.xAI: Grok 4.20
Grok 4.20 — это флагманская модель от xAI, выделяющаяся рекордной скоростью работы и минимальным уровнем галлюцинаций. Она поддерживает контекстное окно до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.
Вход: 150 ₽/MВыход: 299 ₽/M
ТехнологииПрограммирование+3
Читать →
Qwen30 марта 2026 г.Qwen: Qwen3.6 Plus Preview (Бесплатно)
Qwen 3.6 Plus Preview — это флагманская модель нового поколения с гибридной архитектурой, обеспечивающая высокую эффективность и надежность в агентских задачах. Она значительно превосходит серию 3.5 в логических рассуждениях, фронтенд-разработке и решении сложных комплексных проблем.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+2
Читать →
Kwaipilot27 марта 2026 г.
Kwaipilot: KAT-Coder-Pro V2
KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.
Вход: 38 ₽/MВыход: 150 ₽/M
ПрограммированиеТехнологии+1
Читать →
Xiaomi18 марта 2026 г.
Xiaomi: MiMo-V2-Omni
MiMo-V2-Omni от Xiaomi — это передовая мультимодальная модель, способная нативно обрабатывать изображения, видео и аудио в единой архитектуре. Благодаря контекстному окну в 256K и продвинутым агентским навыкам, она эффективно справляется с многошаговым планированием и исполнением кода.
Вход: 48 ₽/MВыход: 240 ₽/M
ТехнологииПрограммирование+2
Читать →
Xiaomi18 марта 2026 г.
Xiaomi: MiMo-V2-Pro
MiMo-V2-Pro — это флагманская модель от Xiaomi с объемом параметров более 1 триллиона и внушительным контекстным окном в 1 миллион токенов. Она специально оптимизирована для работы в качестве «мозга» агентных систем, демонстрируя производительность на уровне топовых мировых решений в бенчмарках PinchBench и ClawBench.
Вход: 120 ₽/MВыход: 359 ₽/M
ТехнологииПрограммирование+2
Читать →
Minimax18 марта 2026 г.
MiniMax: MiniMax M2.7
MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.
Вход: 35 ₽/MВыход: 150 ₽/M
ПрограммированиеФинансы+2
Читать →
Openai17 марта 2026 г.OpenAI: GPT-5.4 Mini
GPT-5.4 Mini — это высокопроизводительная модель, оптимизированная для быстрой обработки больших объемов данных с поддержкой текста и изображений. Она сочетает в себе продвинутые возможности рассуждения и кодинга с низкой задержкой, что делает её идеальной для масштабируемых производственных решений.
Вход: 90 ₽/MВыход: 539 ₽/M
ПрограммированиеТехнологии+2
Читать →
Mistralai16 марта 2026 г.Mistral: Mistral Small 4
Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.
Вход: 19 ₽/MВыход: 75 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai15 марта 2026 г.
Z.ai: GLM 5 Turbo
GLM-5 Turbo от Z.ai — это высокопроизводительная модель, оптимизированная для работы в агентных средах и сценариях OpenClaw. Она демонстрирует исключительную стабильность в длительных рабочих процессах, эффективно справляясь с декомпозицией сложных инструкций и использованием инструментов.
Вход: 144 ₽/MВыход: 479 ₽/M
ТехнологииПрограммирование+1
Читать →
X-ai12 марта 2026 г.xAI: Grok 4.20 Multi-Agent Beta
Grok 4.20 Multi-Agent Beta — это инновационная модель от xAI, использующая систему параллельных агентов для глубоких исследований и координации сложных задач. Благодаря поддержке до 16 агентов в режиме высокого уровня рассуждений, она эффективно синтезирует информацию и работает с контекстом до 2 миллионов токенов.
Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииНаука+2
Читать →
X-ai12 марта 2026 г.xAI: Grok 4.20 Beta
Grok 4.20 Beta — это новый флагман от xAI, выделяющийся рекордной скоростью работы и минимальным уровнем галлюцинаций. Модель поддерживает контекст до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.
Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens11 марта 2026 г.
Hunter Alpha
Hunter Alpha — это передовая интеллектуальная модель, специально разработанная для создания автономных агентов. Она демонстрирует исключительные результаты в долгосрочном планировании и сложном многошаговом рассуждении, обеспечивая высокую точность следования инструкциям.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia11 марта 2026 г.
NVIDIA: Nemotron 3 Super
NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.
Вход: 12 ₽/MВыход: 56 ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia11 марта 2026 г.
NVIDIA: Nemotron 3 Super (Бесплатно)
NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen10 марта 2026 г.Qwen: Qwen3.5-9B
Qwen3.5-9B — это эффективная мультимодальная модель, объединяющая возможности обработки текста, изображений и видео в компактной архитектуре. Благодаря раннему слиянию токенов и контекстному окну в 262 144 токена, она демонстрирует высокие результаты в логических рассуждениях и программировании.
Вход: 5 ₽/MВыход: 19 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai05 марта 2026 г.OpenAI: GPT-5.4 Pro
GPT-5.4 Pro — это флагманская модель от OpenAI с унифицированной архитектурой и продвинутыми способностями к рассуждению. Она обладает внушительным контекстным окном более 1 млн токенов и оптимизирована для решения сложнейших многошаговых задач и агентного программирования.
Вход: 3 312 ₽/MВыход: 19 872 ₽/M
ПрограммированиеТехнологии+3
Читать →
Openai05 марта 2026 г.OpenAI: GPT-5.4
GPT-5.4 — это передовая мультимодальная модель от OpenAI, объединяющая возможности GPT и Codex с контекстным окном более 1 миллиона токенов. Она оптимизирована для сложного программирования, глубокого анализа документов и выполнения многошаговых рабочих процессов с высокой эффективностью.
Вход: 288 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inception04 марта 2026 г.
Inception: Mercury 2
Mercury 2 — это инновационная диффузионная модель (dLLM), обеспечивающая рекордную скорость генерации свыше 1000 токенов в секунду. Она сочетает в себе глубокие рассуждения с параллельной обработкой данных, что делает её в 5 раз быстрее конкурентов при низкой стоимости эксплуатации.
Вход: 32 ₽/MВыход: 94 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai03 марта 2026 г.OpenAI: GPT-5.3 Chat
GPT-5.3 Chat — это обновленная версия популярной модели, ориентированная на естественное общение и высокую точность ответов. Она значительно реже выдает необоснованные отказы и лишние предостережения, обеспечивая плавный и контекстуально точный диалог.
Вход: 202 ₽/MВыход: 1 610 ₽/M
ТехнологииМаркетинг+2
Читать →
Google03 марта 2026 г.Google: Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для массовых задач с поддержкой мультимодальных данных. Она превосходит версию 2.5 Flash Lite по качеству и предлагает гибкую настройку уровней «мышления» для баланса между стоимостью и производительностью.
Вход: 32 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-35B-A3B
Qwen3.5-35B-A3B — это инновационная мультимодальная модель, использующая гибридную архитектуру с линейным вниманием и механизмом Mixture-of-Experts (MoE). Она обеспечивает высокую эффективность инференса и поддерживает обработку текста, изображений и видео в рамках огромного контекстного окна.
Вход: 18 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-27B
Qwen3.5-27B — это производительная мультимодальная модель с линейным механизмом внимания, обеспечивающим высокую скорость отклика. По своим возможностям она сопоставима с более крупной версией 122B, предлагая отличный баланс между эффективностью и качеством обработки визуальных данных.
Вход: 25 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-122B-A10B
Qwen3.5-122B-A10B — это продвинутая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE, обеспечивающая высокую эффективность инференса. Она превосходит предыдущие флагманы Qwen3 по текстовым и визуальным возможностям, занимая второе место в линейке по общей производительности.
Вход: 32 ₽/MВыход: 249 ₽/M
ТехнологииНаука+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-Flash
Qwen3.5-Flash — это быстрая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE. Она обеспечивает мгновенный отклик при работе с текстом, изображениями и видео, поддерживая контекст до 1 миллиона токенов.
Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Liquid25 февраля 2026 г.
LiquidAI: LFM2-24B-A2B
LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.
Вход: 4 ₽/MВыход: 15 ₽/M
ТехнологииНаука+2
Читать →
Google25 февраля 2026 г.Google: Gemini 3.1 Pro Preview Custom Tools
Специализированная версия Gemini 3.1 Pro с оптимизированным механизмом вызова функций и инструментов. Модель эффективнее выбирает пользовательские инструменты вместо стандартных bash-команд, сохраняя при этом мультимодальность и контекстное окно в 1 млн токенов.
Вход: 230 ₽/MВыход: 1 380 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai24 февраля 2026 г.OpenAI: GPT-5.3-Codex
GPT-5.3-Codex — это передовая агентная модель OpenAI, оптимизированная для сложной разработки ПО и взаимодействия с компьютерными интерфейсами. Она демонстрирует рекордные результаты в тестах SWE-Bench Pro и обладает улучшенными навыками работы с терминалом и кибербезопасностью.
Вход: 202 ₽/MВыход: 1 610 ₽/M
ПрограммированиеТехнологии+3
Читать →
Google19 февраля 2026 г.Google: Gemini 3.1 Pro Preview
Gemini 3.1 Pro Preview — это передовая мультимодальная модель от Google с контекстным окном в 1 миллион токенов, оптимизированная для сложного программирования и автономных агентов. Она демонстрирует значительный прогресс в рассуждениях, финансовом моделировании и автоматизации рабочих процессов с использованием инструментов.
Вход: 230 ₽/MВыход: 1 380 ₽/M
ПрограммированиеФинансы+3
Читать →
Anthropic17 февраля 2026 г.Anthropic: Claude Sonnet 4.6
Claude Sonnet 4.6 — это передовая модель от Anthropic, демонстрирующая флагманскую производительность в программировании и управлении сложными проектами. Она обладает уникальными способностями к автоматизации рабочих процессов через управление компьютером и создание качественного контента.
Вход: 345 ₽/MВыход: 1 725 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen16 февраля 2026 г.Qwen: Qwen3.5 Plus 2026-02-15
Qwen3.5 Plus — это передовая мультимодальная модель на гибридной архитектуре, сочетающая линейное внимание и разреженные MoE-слои для высокой эффективности. Она демонстрирует значительный скачок в качестве обработки текста, изображений и видео по сравнению с предыдущим поколением, достигая уровня топовых мировых решений.
Вход: 33 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
Qwen16 февраля 2026 г.Qwen: Qwen3.5 397B A17B
Qwen3.5 397B A17B — это мощная мультимодальная модель на базе гибридной архитектуры MoE и линейного внимания, обеспечивающая высокую эффективность инференса. Она демонстрирует передовые результаты в логическом мышлении, генерации кода и анализе видеоконтента.
Вход: 47 ₽/MВыход: 280 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax12 февраля 2026 г.
MiniMax: MiniMax M2.5 (Бесплатно)
MiniMax M2.5 — это передовая языковая модель, оптимизированная для реальных рабочих задач и офисной продуктивности. Она демонстрирует выдающиеся результаты в программировании и автоматизации работы с документами Word, Excel и PowerPoint, эффективно планируя свои действия.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax12 февраля 2026 г.
MiniMax: MiniMax M2.5
MiniMax M2.5 — это передовая языковая модель, оптимизированная для офисной продуктивности и сложного программирования. Она демонстрирует выдающиеся результаты в работе с документами Word, Excel и PowerPoint, а также эффективно управляет контекстом при переключении между различными программными средами.
Вход: 19 ₽/MВыход: 143 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai11 февраля 2026 г.
Z.ai: GLM 5
GLM-5 от Z.ai — это флагманская open-source модель, специально разработанная для проектирования сложных систем и длительных агентных рабочих процессов. Она ориентирована на экспертную разработку ПО, предлагая возможности автономного планирования и глубокого логического обоснования бэкенд-задач.
Вход: 72 ₽/MВыход: 230 ₽/M
ПрограммированиеТехнологии+2
Читать →
Anthropic04 февраля 2026 г.Anthropic: Claude Opus 4.6
Claude Opus 4.6 — это самая мощная модель от Anthropic, оптимизированная для сложного программирования и длительных профессиональных задач. Она специально разработана для работы в качестве агента, способного управлять целыми рабочими процессами и анализировать огромные объемы данных благодаря контекстному окну в 1 миллион токенов.
Вход: 575 ₽/MВыход: 2 875 ₽/M
ПрограммированиеТехнологии+3
Читать →
Qwen04 февраля 2026 г.Qwen: Qwen3 Coder Next
Qwen3 Coder Next — это специализированная языковая модель с открытыми весами, оптимизированная для задач программирования и локальной разработки. Благодаря архитектуре MoE с 80 миллиардами параметров, из которых активны только 3 миллиарда, она обеспечивает высокую скорость работы при сохранении глубокой экспертизы в кодинге.
Вход: 14 ₽/MВыход: 100 ₽/M
ПрограммированиеТехнологии+1
Читать →
Stepfun29 января 2026 г.
StepFun: Step 3.5 Flash
Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации всего 11 миллиардов параметров из 196 миллиардов, она обеспечивает мгновенные ответы и поддерживает внушительное контекстное окно в 256 тысяч токенов.
Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Stepfun29 января 2026 г.
StepFun: Step 3.5 Flash (Бесплатно)
Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации лишь малой части параметров для каждого токена, она обеспечивает мгновенные ответы при сохранении глубокого понимания контекста до 256 тысяч токенов.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Moonshotai27 января 2026 г.
MoonshotAI: Kimi K2.5
Kimi K2.5 — это передовая мультимодальная модель от Moonshot AI, обученная на колоссальном массиве данных в 15 триллионов токенов. Она выделяется исключительными способностями к визуальному программированию и поддержкой парадигмы автономных агентских систем.
Вход: 48 ₽/MВыход: 228 ₽/M
ПрограммированиеТехнологии+2
Читать →
Liquid20 января 2026 г.
LiquidAI: LFM2.5-1.2B-Thinking (Бесплатно)
LFM2.5-1.2B-Thinking — это компактная модель от LiquidAI, специально оптимизированная для задач логического рассуждения и работы в качестве автономного агента. Несмотря на малый размер, она поддерживает контекст до 32K токенов и эффективно справляется с извлечением данных и RAG-системами.
Вход: — ₽/MВыход: — ₽/M
ТехнологииНаука+2
Читать →
Z-ai19 января 2026 г.
Z.ai: GLM 4.7 Flash
Z.ai: GLM 4.7 Flash — это высокопроизводительная модель класса 30B, оптимизированная для задач программирования и сложного планирования. Благодаря внушительному контекстному окну более 200 тысяч токенов, она эффективно справляется с анализом объемных документов и разработкой комплексных ИИ-агентов.
Вход: 8 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai14 января 2026 г.OpenAI: GPT-5.2-Codex
GPT-5.2-Codex — это продвинутая модель, оптимизированная для сложных инженерных задач и разработки программного обеспечения. Благодаря рекордному контекстному окну в 400 000 токенов и поддержке мультимодального ввода, она способна анализировать целые репозитории и визуальные схемы для написания кода.
Вход: 202 ₽/MВыход: 1 610 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax23 декабря 2025 г.
MiniMax: MiniMax M2.1
MiniMax M2.1 — это компактная и высокопроизводительная модель, специально оптимизированная для написания кода и создания автономных агентов. Несмотря на малый объем активируемых параметров, она демонстрирует выдающиеся результаты в разработке современных приложений и сложных рабочих процессах.
Вход: 37 ₽/MВыход: 118 ₽/M
ПрограммированиеТехнологии+1
Читать →
Z-ai22 декабря 2025 г.
Z.ai: GLM 4.7
Z.ai: GLM 4.7 — это флагманская модель с улучшенными возможностями программирования и стабильным многошаговым рассуждением. Она оптимизирована для выполнения сложных агентских задач и точного исполнения инструкций в рамках длинного контекста.
Вход: 48 ₽/MВыход: 210 ₽/M
ПрограммированиеТехнологии+2
Читать →
Google17 декабря 2025 г.Google: Gemini 3 Flash Preview
Gemini 3 Flash Preview — это высокоскоростная модель нового поколения, оптимизированная для работы автономных агентов и сложных многоэтапных диалогов. Она сочетает в себе глубокое логическое мышление уровня Pro-версий с поддержкой огромного контекстного окна и мультимодальных данных.
Вход: 60 ₽/MВыход: 359 ₽/M
ПрограммированиеТехнологии+2
Читать →
Xiaomi14 декабря 2025 г.
Xiaomi: MiMo-V2-Flash
MiMo-V2-Flash — это открытая языковая модель от Xiaomi, построенная на архитектуре Mixture-of-Experts с гибридным вниманием. При общем объеме в 309 млрд параметров она задействует лишь 15 млрд активных весов, обеспечивая высокую скорость генерации при огромном контекстном окне в 262 тысячи токенов.
Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia14 декабря 2025 г.
NVIDIA: Nemotron 3 Nano 30B A3B
NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 262 144 токенов и высокой вычислительной точности, она идеально подходит для развертывания в частной инфраструктуре.
Вход: 7 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia14 декабря 2025 г.
NVIDIA: Nemotron 3 Nano 30B A3B (Бесплатно)
NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 256 000 токенов и высокой вычислительной точности, она идеально подходит для развертывания на собственной инфраструктуре с соблюдением приватности.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+1
Читать →
Openai10 декабря 2025 г.OpenAI: GPT-5.2 Chat
GPT-5.2 Chat — это высокоскоростная модель в семействе 5.2, оптимизированная для мгновенных ответов с минимальной задержкой. Она сочетает в себе адаптивное рассуждение и поддержку мультимодальных данных, включая текст, изображения и файлы.
Вход: 202 ₽/MВыход: 1 610 ₽/M
ТехнологииПрограммирование+2
Читать →
Openai10 декабря 2025 г.OpenAI: GPT-5.2 Pro
GPT-5.2 Pro — это продвинутая модель от OpenAI, демонстрирующая значительный прогресс в агентном программировании и работе с длинным контекстом. Она оптимизирована для решения сложнейших задач, требующих глубокого пошагового рассуждения и анализа мультимодальных данных.
Вход: 2 319 ₽/MВыход: 18 548 ₽/M
ПрограммированиеТехнологии+3
Читать →
Openai10 декабря 2025 г.OpenAI: GPT-5.2
GPT-5.2 — это передовая мультимодальная модель, ориентированная на создание автономных агентов и работу с огромными массивами данных. Благодаря адаптивному мышлению и контекстному окну в 400 000 токенов, она эффективно справляется со сложным анализом текстов, изображений и файлов.
Вход: 202 ₽/MВыход: 1 610 ₽/M
ТехнологииПрограммирование+2
Читать →
Mistralai09 декабря 2025 г.Mistral: Devstral 2 2512
Devstral 2 2512 — это мощная открытая модель от Mistral AI с 123 млрд параметров, специально оптимизированная для агентного программирования. Благодаря огромному контекстному окну в 256K токенов, она способна анализировать целые репозитории и эффективно решать сложные задачи по написанию кода.
Вход: 48 ₽/MВыход: 240 ₽/M
ПрограммированиеТехнологии+1
Читать →
Relace08 декабря 2025 г.
Relace: Relace Search
Relace Search — это специализированная агентная модель, предназначенная для глубокого исследования кодовой базы. В отличие от стандартных RAG-систем, она использует параллельный запуск инструментов поиска и анализа файлов для предоставления максимально релевантных фрагментов кода.
Вход: 120 ₽/MВыход: 359 ₽/M
ПрограммированиеТехнологии+1
Читать →
Nex-agi08 декабря 2025 г.
Nex AGI: DeepSeek V3.1 Nex N1
Флагманская модель серии Nex-N1, прошедшая специализированное дообучение для повышения автономности и эффективности работы с инструментами. Она ориентирована на решение практических задач и демонстрирует высокую производительность в сценариях реального мира.
Вход: 17 ₽/MВыход: 63 ₽/M
ТехнологииПрограммирование+2
Читать →
Essentialai07 декабря 2025 г.
EssentialAI: Rnj 1 Instruct
EssentialAI: Rnj 1 Instruct — это компактная модель с 8 миллиардами параметров, обученная с нуля для решения сложных аналитических задач. Она демонстрирует высокую эффективность в программировании, математических вычислениях и научном поиске.
Вход: 19 ₽/MВыход: 19 ₽/M
ПрограммированиеНаука+2
Читать →
Alltokens05 декабря 2025 г.
Body Builder (beta)
Body Builder (beta) — это специализированная модель, предназначенная для преобразования естественного языка в структурированные объекты API-запросов alltokens. Она значительно упрощает процесс интеграции ИИ, автоматически формируя корректный синтаксис вызовов на основе текстовых описаний пользователя.
Вход: — ₽/MВыход: — ₽/M
ПрограммированиеТехнологии+1
Читать →
Openai04 декабря 2025 г.OpenAI: GPT-5.1-Codex-Max
GPT-5.1-Codex-Max — это передовая агентная модель от OpenAI, оптимизированная для длительных циклов разработки и работы с огромными кодовыми базами. Благодаря обновленному стеку рассуждений и контекстному окну в 400 000 токенов, она эффективно справляется со сложным рефакторингом и архитектурным проектированием.
Вход: 144 ₽/MВыход: 1 150 ₽/M
ПрограммированиеТехнологии+2
Читать →
Mistralai02 декабря 2025 г.Mistral: Ministral 3 14B 2512
Ministral 3 14B — это флагманская модель в линейке Ministral, предлагающая производительность уровня Mistral Small 24B при более компактном размере. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки сложных данных.
Вход: 25 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Arcee-ai01 декабря 2025 г.
Arcee AI: Trinity Mini
Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.
Вход: 6 ₽/MВыход: 19 ₽/M
ТехнологииПрограммирование+2
Читать →
Arcee-ai01 декабря 2025 г.
Arcee AI: Trinity Mini (Бесплатно)
Trinity Mini — это компактная языковая модель на 26 миллиардов параметров с архитектурой Mixture-of-Experts, оптимизированная для эффективного рассуждения. Она поддерживает внушительное контекстное окно в 131 тысячу токенов и обладает продвинутыми возможностями вызова функций и структурированного вывода.
Вход: — ₽/MВыход: — ₽/M
ТехнологииПрограммирование+2
Читать →
Deepseek01 декабря 2025 г.DeepSeek: DeepSeek V3.2 Speciale
DeepSeek V3.2 Speciale — это высокопроизводительная модель, оптимизированная для сложных рассуждений и работы в качестве автономного агента. Благодаря архитектуре Sparse Attention и усиленному обучению с подкреплением, она эффективно справляется с длинными контекстами и многоступенчатыми задачами.
Вход: 36 ₽/MВыход: 54 ₽/M
ПрограммированиеТехнологии+2
Читать →
Deepseek01 декабря 2025 г.DeepSeek: DeepSeek V3.2
DeepSeek V3.2 — это мощная языковая модель, использующая инновационный механизм разреженного внимания DSA для достижения высокой вычислительной эффективности. Она оптимизирована для сложных рассуждений и уверенной работы с инструментами в агентских сценариях.
Вход: 32 ₽/MВыход: 47 ₽/M
ТехнологииПрограммирование+2
Читать →
Prime-intellect27 ноября 2025 г.
Prime Intellect: INTELLECT-3
INTELLECT-3 — это высокопроизводительная модель на 106 миллиардов параметров с архитектурой Mixture-of-Experts, обученная на базе GLM-4.5-Air. Благодаря глубокому обучению с подкреплением (RL), она демонстрирует выдающиеся результаты в математических вычислениях и логических задачах при высокой скорости работы.
Вход: 25 ₽/MВыход: 137 ₽/M
ТехнологииНаука+2
Читать →
Anthropic24 ноября 2025 г.Anthropic: Claude Opus 4.5
Claude Opus 4.5 — это флагманская модель от Anthropic, созданная для решения сложнейших задач в области программной инженерии и автономных агентских рабочих процессов. Она обладает продвинутыми мультимодальными возможностями и оптимизирована для длительного взаимодействия с компьютерными интерфейсами.
Вход: 575 ₽/MВыход: 2 875 ₽/M
ПрограммированиеТехнологии+2
Читать →
Allenai21 ноября 2025 г.
AllenAI: Olmo 3 32B Think
Olmo 3 32B Think — это специализированная модель на 32 миллиарда параметров, разработанная для глубоких рассуждений и решения сложных логических задач. Она отлично справляется с многошаговыми инструкциями и демонстрирует высокую точность в аналитических сценариях.
Вход: 19 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
Deepcogito13 ноября 2025 г.
Deep Cogito: Cogito v2.1 671B
Deep Cogito v2.1 671B — это мощная модель с архитектурой Mixture-of-Experts, обученная методом Reinforcement Learning. Она демонстрирует производительность уровня флагманских решений, предлагая глубокое логическое рассуждение и работу с контекстом до 128 000 токенов.
Вход: 150 ₽/MВыход: 150 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai13 ноября 2025 г.OpenAI: GPT-5.1
GPT-5.1 представляет собой флагманскую модель нового поколения с улучшенными навыками логического вывода и адаптивным мышлением. Она демонстрирует превосходное следование сложным инструкциям и поддерживает работу с огромным контекстом до 400 000 токенов.
Вход: 144 ₽/MВыход: 1 150 ₽/M
ТехнологииПрограммирование+3
Читать →
Openai13 ноября 2025 г.OpenAI: GPT-5.1 Chat
GPT-5.1 Chat — это высокоскоростная модель, оптимизированная для мгновенного взаимодействия и чатов с минимальной задержкой. Она сочетает в себе общие интеллектуальные способности семейства 5.1 с технологией адаптивного рассуждения для эффективного решения задач.
Вход: 144 ₽/MВыход: 1 150 ₽/M
ТехнологииПрограммирование+2
Читать →
Openai13 ноября 2025 г.OpenAI: GPT-5.1-Codex
GPT-5.1-Codex — это продвинутая модель, специально оптимизированная для разработки программного обеспечения и сложных инженерных задач. Благодаря контекстному окну в 400 000 токенов и поддержке мультимодального ввода, она способна анализировать огромные кодовые базы и выполнять длительные автономные сессии программирования.
Вход: 144 ₽/MВыход: 1 150 ₽/M
ПрограммированиеТехнологии+2
Читать →
Moonshotai06 ноября 2025 г.
MoonshotAI: Kimi K2 Thinking
Kimi K2 Thinking — это передовая модель от Moonshot AI с архитектурой Mixture-of-Experts, предназначенная для решения сложных логических задач. Она специализируется на агентном поведении и длительном планировании, обеспечивая глубокую проработку ответов через цепочки рассуждений.
Вход: 72 ₽/MВыход: 299 ₽/M
ТехнологииНаука+2
Читать →