Лучшие LLM-модели для программирования

Подборка для engineering-задач: генерация кода, рефакторинг, ревью и агентные workflow. В приоритете модели с reasoning и поддержкой tool use.

Моделей в подборке

Средняя цена (вход)

271 ₽/M

Макс. контекст

2.0M

Модели

xAI: Grok 4.20 Multi-Agent

Рассуждения

Grok 4.20 Multi-Agent — это вариант модели xAI Grok 4.20, созданный для совместной работы агентов. Несколько агентов работают параллельно для проведения глубоких исследований, координации использования инструментов и синтеза информации при решении сложных задач. Поведение при затратах на рассуждение: - низкое / среднее: 4 агента - высокое / очень высокое: 16 агентов

от Контекст 2.00M150 ₽/Mвх299 ₽/Mвых

xAI: Grok 4.20

Рассуждения

Grok 4.20 — новейшая флагманская модель xAI с лидирующей скоростью и возможностями агентного вызова инструментов. Она сочетает самый низкий на рынке уровень галлюцинаций с строгим соблюдением инструкций, обеспечивая стабильно точные и правдивые ответы. Режим рассуждений можно включать/выключать с помощью параметра `reasoning` `enabled` в API. Подробнее в наших документах.

от Контекст 2.00M150 ₽/Mвх299 ₽/Mвых

Auto Router

Рассуждения

Ваш запрос будет обработан мета-моделью и направлен в одну из десятков доступных моделей для достижения наилучшего результата. Чтобы узнать, какая именно модель была использована, проверьте историю активности или атрибут model в ответе API. Стоимость запроса соответствует тарифу выбранной модели. Вы можете настроить список моделей для маршрутизации в документации. Запросы направляются в следующие модели: - anthropic/claude-haiku-4.5 - anthropic/claude-opus-4.6 - anthropic/claude-sonnet-4.5 - deepseek/deepseek-r1 - google/gemini-2.5-flash-lite - google/gemini-3-flash-preview - google/gemini-3-pro-preview - meta-llama/llama-3.3-70b-instruct - mistralai/codestral-2508 - mistralai/mistral-large - mistralai/mistral-medium-3.1 - mistralai/mistral-small-3.2-24b-instruct-2506 - moonshotai/kimi-k2-thinking - moonshotai/kimi-k2.5 - openai/gpt-5 - openai/gpt-5-mini - openai/gpt-5-nano - openai/gpt-5.1 - openai/gpt-5.2 - openai/gpt-5.2-pro - openai/gpt-oss-120b - perplexity/sonar - qwen/qwen3-235b-a22b - x-ai/grok-3 - x-ai/grok-3-mini - x-ai/grok-4

от Контекст 2.00MБесплатновхБесплатновых

OpenAI: GPT-5.6 Luna Pro

РассужденияНовая

GPT-5.6 Luna Pro использует ту же базовую модель, что и GPT-5.6 Luna, но с включённым режимом `reasoning.mode` в значении `pro` для получения более качественных ответов на сложные задачи.

от Контекст 1.05M60 ₽/Mвх359 ₽/Mвых

OpenAI: GPT-5.6 Luna

РассужденияНовая

GPT-5.6 Luna — это быстрый и эффективный по затратам модель из серии GPT-5.6. Она подходит для задач с высоким объемом и чувствительностью к задержкам, таких как чат, классификация и легкие агентные рабочие процессы, обеспечивая качественное логическое мышление для...

от Контекст 1.05M60 ₽/Mвх359 ₽/Mвых

OpenAI: GPT-5.6 Terra Pro

РассужденияНовая

GPT-5.6 Terra Pro использует ту же базовую модель, что и GPT-5.6 Terra, но с включённым режимом `reasoning.mode` в значении `pro` для получения более качественных ответов на сложные задачи.

от Контекст 1.05M150 ₽/Mвх897 ₽/Mвых

OpenAI: GPT-5.6 Terra

РассужденияНовая

GPT-5.6 Terra — это сбалансированная модель из серии GPT-5.6, расположенная между флагманским уровнем Sol и экономичным уровнем Luna. Она подходит для повседневного программирования, рассуждений и выполнения агентских задач.

от Контекст 1.05M150 ₽/Mвх897 ₽/Mвых

OpenAI: GPT-5.6 Sol Pro

РассужденияНовая

GPT-5.6 Sol Pro использует ту же базовую модель, что и GPT-5.6 Sol, но с включённым режимом `reasoning.mode` установленным на `pro` для получения более качественных ответов на сложные задачи.

от Контекст 1.05M288 ₽/Mвх1 725 ₽/Mвых

OpenAI: GPT-5.6 Sol

РассужденияНовая

GPT-5.6 Sol — это флагманская модель серии GPT-5.6. Она предназначена для сложных рассуждений, программирования и агентных рабочих процессов, особенно хорошо справляется с задачами командной строки и многошаговым кодированием.

от Контекст 1.05M288 ₽/Mвх1 725 ₽/Mвых

OpenAI: GPT-5.5 Pro

Рассуждения

GPT-5.5 Pro — это высокопроизводительная модель, разработанная для глубокого анализа и высокой точности при работе с комплексными и критически важными задачами. Модель поддерживает контекстное окно более 1 миллиона токенов (922 тысячи входных, 128 тысяч выходных).

от Контекст 1.05M1 656 ₽/Mвх9 936 ₽/Mвых

OpenAI: GPT-5.5

Рассуждения

GPT-5.5 — передовая модель, разработанная для сложных профессиональных задач, основанная на GPT-5.4 с улучшенными возможностями рассуждения, повышенной надежностью и улучшенной эффективностью обработки токенов при выполнении сложных заданий. Модель поддерживает работу с более чем 1 миллионом токенов.

от Контекст 1.05M288 ₽/Mвх1 725 ₽/Mвых

OpenAI: GPT-5.4 Pro

Рассуждения

GPT-5.4 Pro — самая продвинутая модель OpenAI, построенная на унифицированной архитектуре GPT-5.4 с улучшенными способностями к рассуждению для сложных, критически важных задач. Она оснащена контекстным окном в 1M+ токенов (922K входных, 128K выходных) с поддержкой текстовых и изображений входных данных. Оптимизирована для пошагового рассуждения, следования инструкциям и точности, GPT-5.4 Pro отлично справляется с агентным кодированием, рабочими процессами с длинным контекстом и решением многошаговых задач.

от Контекст 1.05M1 656 ₽/Mвх9 936 ₽/Mвых

OpenAI: GPT-5.4

Рассуждения

GPT-5.4 — это последняя флагманская модель OpenAI, объединяющая линии Codex и GPT в единую систему. Она оснащена контекстным окном более 1 млн токенов (922 тыс. входных, 128 тыс. выходных) и поддерживает текстовые и изображенные входные данные, что позволяет выполнять высококонтекстное рассуждение, программирование и мультимодальный анализ в рамках одного рабочего процесса. Модель демонстрирует улучшенные результаты в программировании, анализе документов, использовании инструментов и следовании инструкциям. Она разработана как надежный выбор как для общих задач, так и для разработки программного обеспечения, способна генерировать код промышленного качества, синтезировать информацию из множественных источников и выполнять сложные многошаговые рабочие процессы с меньшим количеством итераций и большей эффективностью использования токенов.

от Контекст 1.05M150 ₽/Mвх897 ₽/Mвых

Google: Gemini 3.1 Pro Preview Custom Tools

Рассуждения

Gemini 3.1 Pro Preview Custom Tools — это специализированная версия модели Gemini 3.1 Pro, в которой оптимизирован механизм выбора инструментов. Модель реже использует стандартный bash-инструмент в тех случаях, когда доступны более эффективные сторонние или пользовательские функции. Этот предварительный эндпоинт на alltokens значительно повышает надежность вызова функций и гарантирует, что модель выберет наиболее подходящий инструмент в сценариях с кодинг-агентами и сложными рабочими процессами, включающими множество инструментов. Модель сохраняет все ключевые преимущества Gemini 3.1 Pro, включая мультимодальное рассуждение при работе с текстом, изображениями, видео, аудио и кодом, контекстное окно объемом 1 миллион токенов и высокую производительность в задачах разработки программного обеспечения.

от Контекст 1.05M230 ₽/Mвх1 380 ₽/Mвых

Z.ai: GLM 5.2

Рассуждения

GLM-5.2 — флагманская модель Z.ai для задач с длительным горизонтом. Обладая действительно применимым контекстным окном в 1 миллион токенов, она способна работать с инженерным контекстом на уровне проектов, выполнять длительные задачи с повышенной надежностью и следовать сложным инструкциям.

от Контекст 1.05M44 ₽/Mвх137 ₽/Mвых

MiniMax: MiniMax M3

Рассуждения

#16 в рейтинге

MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает ввод текста, изображений и видео с текстовым выводом, обладает контекстным окном на 1 миллион токенов и подходит для задач с длительным горизонтом, агентных систем, программирования и других применений.

от Контекст 1.05M38 ₽/Mвх150 ₽/Mвых

Google: Gemini 3.5 Flash

Рассуждения

Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution...

от Контекст 1.05M90 ₽/Mвх539 ₽/Mвых

Google: Gemini 3.1 Flash Lite

Рассуждения

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.

от Контекст 1.05M16 ₽/Mвх94 ₽/Mвых

DeepSeek: DeepSeek V4 Pro

Рассуждения

#14 в рейтинге

DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window. It is designed for advanced reasoning, coding,...

от Контекст 1.05M55 ₽/Mвх109 ₽/Mвых

DeepSeek: DeepSeek V4 Flash

Рассуждения

🥉 #3 в рейтинге

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

от Контекст 1.05M10 ₽/Mвх20 ₽/Mвых

Xiaomi: MiMo-V2.5-Pro

Рассуждения

MiMo-V2.5-Pro — флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентных задачах, сложном программном инжиниринге и долгосрочных проектах, занимая лидирующие позиции в бенчмарках, таких как ClawEval, GDPVal и SWE-bench Pro.

от Контекст 1.05M55 ₽/Mвх109 ₽/Mвых

Xiaomi: MiMo-V2.5

Рассуждения

MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность уровня Pro для агентных задач примерно за половину стоимости вывода, при этом превосходя MiMo-V2-Omni в мультимодальном восприятии при анализе изображений и видео.

от Контекст 1.05M14 ₽/Mвх35 ₽/Mвых

Google: Gemini 3.1 Flash Lite Preview

Рассуждения

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для задач с высоким объемом использования. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым возможностям. Улучшения охватывают аудиовход/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и завершение кода. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки компромисса между стоимостью и производительностью. Стоит в два раза дешевле Gemini 3 Flash.

от Контекст 1.05M16 ₽/Mвх94 ₽/Mвых

Google: Gemini 3.1 Pro Preview

Рассуждения

Gemini 3.1 Pro Preview — это передовая модель Google с расширенными возможностями рассуждения, обеспечивающая повышенную производительность в разработке программного обеспечения, надежность работы агентов и эффективное использование токенов в сложных рабочих процессах. Основанная на мультимодальной базе серии Gemini 3, она сочетает в себе высокоточное логическое мышление при работе с текстом, изображениями, видео, аудио и кодом с контекстным окном в 1 миллион токенов. При использовании многошагового вызова инструментов на alltokens необходимо сохранять детали рассуждений. Обновление 3.1 демонстрирует измеримый рост в тестах SWE и реальных средах программирования, а также более уверенное выполнение автономных задач в структурированных областях, таких как финансы и работа с электронными таблицами. Разработанная для продвинутой разработки и агентных систем, Gemini 3.1 Pro Preview улучшает стабильность при выполнении длительных задач и оркестрацию инструментов, одновременно повышая эффективность расхода токенов. В модели представлен новый средний уровень мышления для оптимального баланса стоимости, скорости и производительности. Модель отлично справляется с написанием кода через агентов, структурированным планированием, мультимодальным анализом и автоматизацией рабочих процессов, что делает ее подходящей для автономных агентов, финансового моделирования, автоматизации таблиц и корпоративных задач с большим объемом контекста.

от Контекст 1.05M120 ₽/Mвх718 ₽/Mвых

Google: Gemini 3 Flash Preview

Рассуждения

#20 в рейтинге

Gemini 3 Flash Preview — это высокоскоростная и эффективная модель с поддержкой логических рассуждений, разработанная для агентных рабочих процессов, многошаговых диалогов и помощи в написании кода. Она обеспечивает производительность в рассуждениях и использовании инструментов на уровне, близком к версии Pro, но с существенно меньшей задержкой, чем у более крупных вариантов Gemini. Это делает ее оптимальным выбором для интерактивной разработки, длительных циклов работы агентов и совместного программирования. По сравнению с Gemini 2.5 Flash, данная модель предлагает значительные улучшения в качестве логических выводов, мультимодальном понимании и надежности. Модель поддерживает контекстное окно объемом 1 миллион токенов и мультимодальные входные данные, включая текст, изображения, аудио, видео и PDF-файлы, с выводом в текстовом формате. Функционал включает настраиваемые уровни рассуждений (минимальный, низкий, средний, высокий), структурированный вывод, использование инструментов и автоматическое кэширование контекста. Gemini 3 Flash Preview оптимизирована для пользователей, которым требуются развитые способности к рассуждению и агентное поведение без затрат и задержек, характерных для полномасштабных флагманских моделей.

от Контекст 1.05M32 ₽/Mвх187 ₽/Mвых

Google: Gemini 2.5 Flash Lite

Рассуждения

🏆 #1 в рейтинге

Gemini 2.5 Flash-Lite — это облегченная модель в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, ускоренную генерацию токенов и лучшие показатели в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция рассуждений отключена для обеспечения максимальной скорости работы, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повысить интеллектуальные возможности модели за счет увеличения стоимости. На платформе alltokens вы можете интегрировать данную модель в свои проекты.

от Контекст 1.05M7 ₽/Mвх25 ₽/Mвых

Google: Gemini 2.5 Flash

Рассуждения

#10 в рейтинге

Gemini 2.5 Flash — это передовая высокопроизводительная модель от Google, специально разработанная для сложного логического вывода, написания кода, решения математических и научных задач. Она оснащена встроенными механизмами рассуждения, что позволяет ей выдавать ответы с повышенной точностью и глубокой проработкой контекста. Кроме того, Gemini 2.5 Flash поддерживает настройку через параметр max tokens for reasoning, доступный в API alltokens.

от Контекст 1.05M19 ₽/Mвх156 ₽/Mвых

Google: Gemini 2.5 Pro

Рассуждения

Gemini 2.5 Pro — это современная модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического рассуждения, программирования, математики и естественных наук. Модель использует возможности глубокого мышления, что позволяет ей выстраивать цепочки рассуждений для достижения повышенной точности и тонкой работы с контекстом. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных тестах и занимает первое место в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем.

от Контекст 1.05M75 ₽/Mвх598 ₽/Mвых

Google: Gemini 2.5 Pro Preview 06-05

Рассуждения

Gemini 2.5 Pro — это современная модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического рассуждения, программирования, математики и естественных наук. Модель использует возможности глубокого мышления, что позволяет ей выстраивать цепочки рассуждений для достижения повышенной точности и тонкой обработки контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных тестах и занимает лидирующие позиции в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем. Доступ к модели осуществляется через API alltokens.

от Контекст 1.05M75 ₽/Mвх598 ₽/Mвых

Google: Gemini 2.5 Pro Preview 05-06

Рассуждения

Gemini 2.5 Pro — это передовая модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического мышления, программирования, математики и естественных наук. Модель использует возможности глубокого рассуждения, что позволяет ей выстраивать цепочки мыслей для достижения повышенной точности и тонкой обработки контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных бенчмарках и занимает первое место в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем. Доступ к модели осуществляется через API alltokens.

от Контекст 1.05M75 ₽/Mвх598 ₽/Mвых

Anthropic: Claude Sonnet 5

Рассуждения

Sonnet 5 — самая мощная модель класса Sonnet от Anthropic, демонстрирующая передовые результаты в программировании, работе с агентами и профессиональной деятельности. Модель поддерживает адаптивное мышление с возможностью выбора уровня усилий для рассуждений (низкий, средний, высокий, максимальный и другие).

от Контекст 1.00M230 ₽/Mвх1 150 ₽/Mвых

Sakana: Fugu Ultra

Рассуждения

Fugu Ultra — это высокопроизводительная модель из семейства Fugu компании Sakana AI. Вместо одного монолитного решения Fugu представляет собой обученную систему многозадачного управления агентами: языковую модель, обученную направлять запросы...

от Контекст 1.00M575 ₽/Mвх3 450 ₽/Mвых

Anthropic: Claude Fable 5

Рассуждения

Claude Fable 5 — модель класса Mythos от Anthropic, созданная для автономной работы с знаниями и программирования. Поддерживает ввод текста, изображений и файлов с текстовым выводом, обеспечивает поддержку логического мышления и...

от Контекст 1.00M1 104 ₽/Mвх5 520 ₽/Mвых

NVIDIA: Nemotron 3 Ultra

Рассуждения

NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

от Контекст 1.00M60 ₽/Mвх264 ₽/Mвых

NVIDIA: Nemotron 3 Ultra (Бесплатно)

Рассуждения

#6 в рейтинге

NVIDIA Nemotron 3 Ultra — это модель для рассуждений на открытых темах и оркестровки от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

от Контекст 1.00MБесплатновхБесплатновых

Qwen: Qwen3.7 Plus

Рассуждения

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 компании Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, расширяя текстовые возможности серии за счёт комплексного улучшения...

от Контекст 1.00M40 ₽/Mвх159 ₽/Mвых

Anthropic: Claude Opus 4.8 (Fast)

Рассуждения

Вариант Opus 4.8 в быстром режиме — те же возможности при удвоенной скорости вывода по сравнению с обычным Opus 4.8.

от Контекст 1.00M1 104 ₽/Mвх5 520 ₽/Mвых

Anthropic: Claude Opus 4.8

Рассуждения

Claude Opus 4.8 — это самая мощная общедоступная модель из семейства Opus от Anthropic. Она поддерживает ввод текста, изображений и файлов с текстовым выводом, обладает возможностями логического рассуждения и обработкой большого объема токенов.

от Контекст 1.00M575 ₽/Mвх2 875 ₽/Mвых

Qwen: Qwen3.7 Max

Рассуждения

Qwen3.7-Max — это флагманская модель серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и предназначена для задач, ориентированных на работу агентов, с особой эффективностью в программировании, офисных и продуктивных задачах.

от Контекст 1.00M150 ₽/Mвх449 ₽/Mвых

Anthropic: Claude Opus 4.7 (Fast)

Рассуждения

Вариант Opus 4.7 в быстром режиме — те же возможности с повышенной скоростью вывода.

от Контекст 1.00M3 312 ₽/Mвх16 560 ₽/Mвых

xAI: Grok 4.3

Рассуждения

Grok 4.3 — это модель рассуждения от xAI. Она принимает текстовые и графические данные на вход и выдает текстовый ответ. Модель подходит для агентных рабочих процессов, задач, связанных с выполнением инструкций, а также для приложений, требующих высокой точности фактической информации.

от Контекст 1.00M150 ₽/Mвх299 ₽/Mвых

Qwen: Qwen3.5 Plus 2026-04-20

Рассуждения

Qwen3.5 Plus (апрель 2026) — крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, поддерживая контекстное окно размером 1 миллион токенов.

от Контекст 1.00M36 ₽/Mвх216 ₽/Mвых

Qwen: Qwen3.6 Flash

Рассуждения

Qwen3.6 Flash — это быстрый и эффективный языковой модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов.

от Контекст 1.00M24 ₽/Mвх140 ₽/Mвых

Anthropic: Claude Opus 4.7

Рассуждения

Opus 4.7 - это следующее поколение семейства Anthropic Opus, созданное для долгосрочных асинхронных агентов. Основываясь на сильных сторонах Opus 4.6 в области программирования и агентных возможностях, он обеспечивает более высокую производительность в...

от Контекст 1.00M575 ₽/Mвх2 875 ₽/Mвых

Qwen: Qwen3.6 Plus

Рассуждения

Qwen 3.6 Plus основан на гибридной архитектуре, сочетающей эффективное линейное внимание с разреженным маршрутизатором смеси экспертов, что обеспечивает высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он обеспечивает...

от Контекст 1.00M39 ₽/Mвх234 ₽/Mвых

NVIDIA: Nemotron 3 Super

Рассуждения

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Многосредовое обучение с подкреплением (RL) на 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

от Контекст 1.00M10 ₽/Mвх50 ₽/Mвых

NVIDIA: Nemotron 3 Super (Бесплатно)

Рассуждения

#4 в рейтинге

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Мульти-средовое обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

от Контекст 1.00MБесплатновхБесплатновых

Qwen: Qwen3.5-Flash

Рассуждения

Модели Qwen3.5 Flash с нативной поддержкой визуально-языковых задач построены на гибридной архитектуре, объединяющей механизм линейного внимания с разреженной моделью смеси экспертов, что обеспечивает более высокую эффективность логического вывода. По сравнению с третьей серией, эти модели демонстрируют качественный скачок производительности как в текстовых, так и в мультимодальных задачах, обеспечивая быстрый отклик при оптимальном балансе скорости генерации и общего качества работы.

от Контекст 1.00M9 ₽/Mвх33 ₽/Mвых

Anthropic: Claude Sonnet 4.6

Рассуждения

#15 в рейтинге

Sonnet 4.6 — самая мощная модель класса Sonnet от Anthropic на сегодняшний день, демонстрирующая передовую производительность в программировании, работе с агентами и профессиональных задачах. Она отлично справляется с итеративной разработкой, навигацией по сложным кодовым базам, сквозным управлением проектами с использованием памяти, созданием качественной документации и уверенным управлением интерфейсом компьютера для тестирования веб-приложений и автоматизации рабочих процессов.

от Контекст 1.00M345 ₽/Mвх1 725 ₽/Mвых

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждения

Серия мультимодальных моделей Qwen3.5 Plus построена на гибридной архитектуре, которая объединяет механизмы линейного внимания с разреженными моделями смеси экспертов (MoE), что обеспечивает более высокую эффективность логического вывода. В ходе оценки различных задач серия 3.5 стабильно демонстрирует производительность на уровне ведущих современных моделей. По сравнению с третьей серией, эти модели представляют собой значительный качественный скачок как в обработке чисто текстовых данных, так и в мультимодальных возможностях.

от Контекст 1.00M33 ₽/Mвх194 ₽/Mвых

Anthropic: Claude Opus 4.6

Рассуждения

Opus 4.6 — самая мощная модель Anthropic для программирования и длительных профессиональных задач. Она создана для агентов, работающих с целыми рабочими процессами, а не с отдельными запросами, что делает ее особенно эффективной для работы с крупными кодовыми базами, сложного рефакторинга и многоэтапной отладки. Модель демонстрирует более глубокое понимание контекста, улучшенную декомпозицию проблем и повышенную надежность при выполнении сложных инженерных задач по сравнению с предыдущими поколениями. Помимо написания кода, Opus 4.6 отлично справляется с длительной интеллектуальной работой. Она создает документы, планы и аналитические отчеты высокого качества за один проход, сохраняя логическую связность в очень длинных ответах и при продолжительных сессиях. Это делает ее оптимальным выбором для задач, требующих настойчивости, взвешенных суждений и доведения дела до конца, таких как техническое проектирование, планирование миграций и комплексное выполнение проектов. Для пользователей, переходящих с предыдущих версий Opus, на alltokens доступны рекомендации по миграции.

от Контекст 1.00M575 ₽/Mвх2 875 ₽/Mвых

Amazon: Nova 2 Lite

Рассуждения

Nova 2 Lite — это быстрая и экономичная модель рассуждения для повседневных задач, способная обрабатывать текст, изображения и видео для генерации текстовых ответов. Nova 2 Lite демонстрирует выдающиеся возможности в обработке документов, извлечении информации из видео, написании программного кода, предоставлении точных обоснованных ответов и автоматизации многоэтапных рабочих процессов с использованием агентов.

от Контекст 1.00M36 ₽/Mвх299 ₽/Mвых

Anthropic: Claude Sonnet 4.5

Рассуждения

Claude Sonnet 4.5 — это самая совершенная модель в линейке Sonnet от Anthropic на сегодняшний день, оптимизированная для работы автономных агентов и процессов разработки ПО. Она демонстрирует передовую производительность в тестах программирования, таких как SWE-bench Verified, показывая значительные улучшения в проектировании систем, безопасности кода и соблюдении спецификаций. Модель разработана для длительной автономной работы, обеспечивая непрерывность выполнения задач между сессиями и предоставляя отчеты о прогрессе на основе фактов. Sonnet 4.5 также внедряет расширенные агентные возможности, включая улучшенную оркестрацию инструментов, спекулятивное параллельное выполнение, а также более эффективное управление контекстом и памятью. Благодаря улучшенному отслеживанию контекста и контролю использования токенов при вызовах инструментов, модель особенно эффективна для многозадачных и длительных рабочих процессов. Сферы применения охватывают программную инженерию, кибербезопасность, финансовый анализ, исследовательских агентов и другие области, требующие глубоких рассуждений и активного использования внешних инструментов.

от Контекст 1.00M345 ₽/Mвх1 725 ₽/Mвых

Qwen: Qwen Plus 0728 (thinking)

Рассуждения

Qwen Plus 0728, созданная на базе фундаментальной модели Qwen3, представляет собой гибридную модель для рассуждений с контекстным окном в 1 миллион токенов. Она обеспечивает оптимальное сочетание производительности, скорости работы и стоимости.

от Контекст 1.00M33 ₽/Mвх97 ₽/Mвых

MiniMax: MiniMax M1

Рассуждения

MiniMax-M1 — это масштабная модель с открытыми весами, предназначенная для глубоких рассуждений, работы с расширенным контекстом и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с механизмом lightning attention, что позволяет обрабатывать последовательности длиной до 1 миллиона токенов при сохранении конкурентоспособной вычислительной эффективности. Общее количество параметров модели составляет 456 миллиардов, из которых 45,9 миллиарда активны для каждого токена. Данная версия оптимизирована для решения сложных многоэтапных логических задач. Благодаря обучению с помощью специализированного конвейера обучения с подкреплением (CISPO), M1 демонстрирует выдающиеся результаты в понимании длинного контекста, программной инженерии, использовании инструментов в режиме агента и математических рассуждениях. Тесты показывают высокую производительность в FullStackBench, SWE-bench, MATH, GPQA и TAU-Bench, где модель часто превосходит другие открытые решения, такие как DeepSeek R1 и Qwen3-235B. На платформе alltokens модель доступна для интеграции в различные рабочие процессы.

от Контекст 1.00M48 ₽/Mвх264 ₽/Mвых

Anthropic: Claude Sonnet 4

Рассуждения

Claude Sonnet 4 значительно расширяет возможности своего предшественника Sonnet 3.7, демонстрируя превосходные результаты в задачах программирования и логического вывода с повышенной точностью и управляемостью. Достигнув рекордных показателей в тесте SWE-bench (72,7%), Sonnet 4 обеспечивает баланс между производительностью и вычислительной эффективностью. Это делает модель подходящей для широкого спектра задач: от повседневного написания кода до сложных проектов по разработке программного обеспечения. Ключевые улучшения включают усовершенствованную автономную навигацию по кодовой базе, снижение частоты ошибок в рабочих процессах с использованием агентов и повышенную надежность при выполнении сложных инструкций. Sonnet 4 оптимизирована для практического ежедневного использования, предоставляя передовые возможности рассуждения при сохранении высокой скорости отклика в различных сценариях работы. Все возможности модели доступны через API alltokens.

от Контекст 1.00M345 ₽/Mвх1 725 ₽/Mвых

xAI: Grok 4.5

РассужденияНовая

Grok 4.5 — самая продвинутая модель SpaceXAI с передовыми возможностями в области программирования, интеллектуальной работы и точных наук.

от Контекст 500K240 ₽/Mвх718 ₽/Mвых

OpenAI: GPT-5.4 Nano

Рассуждения

GPT-5.4 nano — это самая легкая и экономичная версия семейства GPT-5.4, оптимизированная для задач, требующих высокой скорости и обработки больших объемов данных. Модель поддерживает текстовые и изображенческие входные данные и предназначена для использования в случаях, где критична низкая задержка, таких как классификация, извлечение данных, ранжирование и выполнение подагентов. Модель делает упор на быстроту отклика и эффективность, а не на глубокое рассуждение, что делает ее идеальной для пайплайнов, требующих быстрых и надежных результатов в больших масштабах. GPT-5.4 nano отлично подходит для фоновых задач, систем реального времени и распределенных архитектур агентов, где минимизация затрат и задержек имеет первостепенное значение.

от Контекст 400K13 ₽/Mвх78 ₽/Mвых

OpenAI: GPT-5.4 Mini

Рассуждения

GPT-5.4 mini предлагает основные возможности GPT-5.4 в более быстрой и эффективной модели, оптимизированной для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и изображения входные данные с высокой производительностью в рассуждениях, программировании и использовании инструментов, при этом снижая задержку и стоимость для крупномасштабных развертываний. Модель разработана для производственных сред, требующих баланса между возможностями и эффективностью, что делает ее отличным выбором для чат-приложений, программистских ассистентов и агентских рабочих процессов, работающих в масштабе. GPT-5.4 mini обеспечивает надежное следование инструкциям, солидное многошаговое рассуждение и стабильную производительность по разнообразным задачам с улучшенной экономичностью.

от Контекст 400K45 ₽/Mвх270 ₽/Mвых

OpenAI: GPT-5.3-Codex

Рассуждения

GPT-5.3-Codex — это самая совершенная агентная модель OpenAI для написания кода, объединяющая передовую производительность в области программной инженерии GPT-5.2-Codex с расширенными возможностями рассуждения и профессиональными знаниями GPT-5.2. Модель демонстрирует лучшие в отрасли результаты в тестах SWE-Bench Pro, а также высокие показатели в Terminal-Bench 2.0 и OSWorld-Verified, что подтверждает улучшенные навыки многоязычного программирования, владения терминалом и взаимодействия с компьютерной средой в реальных условиях. Модель оптимизирована для длительных рабочих процессов с использованием инструментов и поддерживает интерактивное управление во время выполнения, что делает ее подходящей для сложных задач разработки, отладки, развертывания и итеративной работы над продуктом. Помимо программирования, GPT-5.3-Codex показывает отличные результаты в бенчмарках для структурированной интеллектуальной работы, таких как GDPval, поддерживая такие задачи, как составление документов, анализ электронных таблиц, создание презентаций и операционные исследования в различных областях. Модель обучена с повышенным вниманием к кибербезопасности, включая возможности выявления уязвимостей, и развернута с дополнительными мерами защиты для сценариев использования с высоким уровнем риска. По сравнению с предыдущими моделями Codex, она более эффективна в расходе токенов и работает примерно на 25% быстрее, ориентируясь на профессиональные сквозные рабочие процессы, охватывающие логические рассуждения, выполнение кода и взаимодействие с компьютером.

от Контекст 400K202 ₽/Mвх1 610 ₽/Mвых

FAQ

Какие признаки у хорошей модели для кодинга?

Практически важны reasoning, стабильность следования инструкциям, поддержка инструментов и длинный контекст.

Почему в подборке есть разные провайдеры?

Потому что для разных задач (быстрая генерация, сложный рефакторинг, агентный цикл) лучшие модели различаются.

Смежные подборки

OpenAI модели Anthropic модели Google Gemini модели Недорогие модели Модели с длинным контекстом Мультимодальные модели

Лучшие для задач

Кодинг и AI-агенты

Модели для генерации кода, рефакторинга и tool use в агентных workflow.

лучшие модели для программирования и AI-агентов

OpenAI стек

Актуальные OpenAI модели для продакшн-интеграций через единый API.

актуальные OpenAI модели и цены

Anthropic стек

Claude-линейка для надежного reasoning и сложных задач в проде.

модели Anthropic Claude для сложных задач

Новости по теме

Смотреть новости по этой подборке Новости: xAI: Grok 4.20 Multi-Agent Новости: xAI: Grok 4.20 Новости: Auto Router Новости: OpenAI: GPT-5.6 Luna Pro Новости: OpenAI: GPT-5.6 Luna

Модели

xAI: Grok 4.20 Multi-Agent

xAI: Grok 4.20

Auto Router

OpenAI: GPT-5.6 Luna Pro

OpenAI: GPT-5.6 Luna

OpenAI: GPT-5.6 Terra Pro

OpenAI: GPT-5.6 Terra

OpenAI: GPT-5.6 Sol Pro

OpenAI: GPT-5.6 Sol

OpenAI: GPT-5.5 Pro

OpenAI: GPT-5.5

OpenAI: GPT-5.4 Pro

OpenAI: GPT-5.4

Google: Gemini 3.1 Pro Preview Custom Tools

Z.ai: GLM 5.2

MiniMax: MiniMax M3

Google: Gemini 3.5 Flash

Google: Gemini 3.1 Flash Lite

DeepSeek: DeepSeek V4 Pro

DeepSeek: DeepSeek V4 Flash

Xiaomi: MiMo-V2.5-Pro

Xiaomi: MiMo-V2.5

Google: Gemini 3.1 Flash Lite Preview

Google: Gemini 3.1 Pro Preview

Google: Gemini 3 Flash Preview

Google: Gemini 2.5 Flash Lite

Google: Gemini 2.5 Flash

Google: Gemini 2.5 Pro

Google: Gemini 2.5 Pro Preview 06-05

Google: Gemini 2.5 Pro Preview 05-06

Anthropic: Claude Sonnet 5

Sakana: Fugu Ultra

Anthropic: Claude Fable 5

NVIDIA: Nemotron 3 Ultra

NVIDIA: Nemotron 3 Ultra (Бесплатно)

Qwen: Qwen3.7 Plus

Anthropic: Claude Opus 4.8 (Fast)

Anthropic: Claude Opus 4.8

Qwen: Qwen3.7 Max

Anthropic: Claude Opus 4.7 (Fast)

xAI: Grok 4.3

Qwen: Qwen3.5 Plus 2026-04-20

Qwen: Qwen3.6 Flash

Anthropic: Claude Opus 4.7

Qwen: Qwen3.6 Plus

NVIDIA: Nemotron 3 Super

NVIDIA: Nemotron 3 Super (Бесплатно)

Qwen: Qwen3.5-Flash

Anthropic: Claude Sonnet 4.6

Qwen: Qwen3.5 Plus 2026-02-15

Anthropic: Claude Opus 4.6

Amazon: Nova 2 Lite

Anthropic: Claude Sonnet 4.5

Qwen: Qwen Plus 0728 (thinking)

MiniMax: MiniMax M1

Anthropic: Claude Sonnet 4

xAI: Grok 4.5

OpenAI: GPT-5.4 Nano

OpenAI: GPT-5.4 Mini

OpenAI: GPT-5.3-Codex

Похожие модели внутри подборки

Близкие по цене

Близкие по контексту

Близкие по параметрам

FAQ

Какие признаки у хорошей модели для кодинга?

Почему в подборке есть разные провайдеры?

Смежные подборки

Лучшие для задач

Новости по теме

Продукт

Платформа

Контент

Разработчикам

Право

Контакты