Модели

Сравнивайте модели по модальностям, контексту, цене и API-параметрам.

381 моделей

Anthropic: Claude Opus 4.7 (Fast)

РассужденияНовая

Вариант Opus 4.7 в быстром режиме — те же возможности с повышенной скоростью вывода.

от Контекст 1.00M3 312 ₽/Mвх16 560 ₽/Mвых

Perceptron: Perceptron Mk1

РассужденияНовая

Perceptron Mk1 (Mark One) — это высококачественная модель восприятия языка и зрения Perceptron, предназначенная для работы с видео и воплощённым рассуждением. Она принимает изображения и видео вместе с запросами на естественном языке и обеспечивает детальное визуальное понимание.

от Контекст 33K19 ₽/Mвх187 ₽/Mвых

inclusionAI: Ring-2.6-1T

Рассуждения

Ring-2.6-1T — это модель мышления с масштабом в 1 триллион параметров и 63 миллиардами активных параметров, разработанная для рабочих процессов агентов в реальных условиях, требующих высокой производительности и операционной эффективности. Модель оптимизирована для агентов, работающих с кодом и инструментами.

от Контекст 262K10 ₽/Mвх78 ₽/Mвых

Google: Gemini 3.1 Flash Lite

Рассуждения

#19 в рейтинге

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.

от Контекст 1.05M32 ₽/Mвх187 ₽/Mвых

Baidu Qianfan: CoBuddy (Бесплатно)

Рассуждения

CoBuddy — это модель генерации кода от Baidu, оптимизированная для задач программирования и рабочих процессов AI-агентов. Она обеспечивает высокую пропускную способность при выводе и низкую задержку от начала до конца, с нативной поддержкой инструментов.

от Контекст 131KБесплатновхБесплатновых

Гайд

Как выбрать AI-модель под задачу

Определите use-case, сравните 3-5 моделей по качеству, цене и контексту и протестируйте на ваших реальных запросах.

Полный гайд по выбору моделей

OpenAI: GPT Chat Latest

GPT Chat Latest использует стабильный API OpenAI с псевдонимом `chat-latest`, который всегда указывает на последнюю версию модели Instant chat. По мере выхода новых обновлений модели Instant, этот псевдоним будет автоматически перенаправлять на самую свежую версию.

от Контекст 400K575 ₽/Mвх3 450 ₽/Mвых

xAI: Grok 4.3

Рассуждения

Grok 4.3 — это модель рассуждения от xAI. Она принимает текстовые и графические данные на вход и выдает текстовый ответ. Модель подходит для агентных рабочих процессов, задач, связанных с выполнением инструкций, а также для приложений, требующих высокой точности фактической информации.

от Контекст 1.00M150 ₽/Mвх299 ₽/Mвых

IBM: Granite 4.1 8B

Granite 4.1 8B — это плотная языковая модель только с декодером, содержащая 8 миллиардов параметров, разработанная IBM и являющаяся частью семейства Granite 4.1. Модель поддерживает контекстное окно размером 131 тысячу токенов и предназначена для корпоративных задач.

от Контекст 131K7 ₽/Mвх13 ₽/Mвых

Mistral: Mistral Medium 3.5

Рассуждения

Mistral Medium 3.5 — это компактная модель с 128 миллиардами параметров от Mistral AI, ориентированная на выполнение инструкций. Она поддерживает ввод текста и изображений с текстовым выводом и предназначена для агентских рабочих процессов, программирования и решения сложных задач.

от Контекст 262K180 ₽/Mвх897 ₽/Mвых

Owl Alpha

Owl Alpha — это высокопроизводительная базовая модель, разработанная для агентных задач. Она изначально поддерживает использование инструментов и работу с длинным контекстом, демонстрируя высокую эффективность в генерации кода, автоматизации рабочих процессов и выполнении сложных инструкций.

от Контекст 1.05MБесплатновхБесплатновых

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

Рассуждения

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель с 30 миллиардами параметров, разработанная для работы в качестве подсистемы восприятия и контекста в корпоративных агентных системах. Модель принимает текст, изображения, видео и другие виды данных.

от Контекст 256KБесплатновхБесплатновых

Poolside: Laguna XS.2 (Бесплатно)

Рассуждения

Laguna XS.2 — модель второго поколения в классе XS от Poolside, их серии эффективных агентов для кодирования. Она сочетает в себе возможности вызова инструментов и логического мышления при компактных размерах, предлагая...

от Контекст 131KБесплатновхБесплатновых

Poolside: Laguna M.1 (Бесплатно)

Рассуждения

#5 в рейтинге

Laguna M.1 — это флагманская модель агента для программирования от Poolside, оптимизированная для выполнения сложных задач в области разработки программного обеспечения. Созданная для агентных рабочих процессов программирования, модель поддерживает вызов инструментов и логическое рассуждение, с контекстом в 128 тысяч токенов.

от Контекст 131KБесплатновхБесплатновых

Anthropic Claude Haiku Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю версию модели из семейства Anthropic Claude Haiku.

от Контекст 200K120 ₽/Mвх598 ₽/Mвых

OpenAI GPT Mini Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю модель из семейства OpenAI GPT Mini.

от Контекст 400K90 ₽/Mвх539 ₽/Mвых

Google Gemini Pro Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Pro.

от Контекст 1.05M230 ₽/Mвх1 380 ₽/Mвых

MoonshotAI Kimi Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю версию модели из семейства MoonshotAI Kimi.

от Контекст 262K88 ₽/Mвх418 ₽/Mвых

Google Gemini Flash Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.

от Контекст 1.05M60 ₽/Mвх359 ₽/Mвых

Anthropic Claude Sonnet Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю версию модели из семейства Anthropic Claude Sonnet.

от Контекст 1.00M345 ₽/Mвх1 725 ₽/Mвых

OpenAI GPT Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю модель из семейства GPT компании OpenAI.

от Контекст 1.05M575 ₽/Mвх3 450 ₽/Mвых

Qwen: Qwen3.5 Plus 2026-04-20

Рассуждения

Qwen3.5 Plus (апрель 2026) — крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, поддерживая контекстное окно размером 1 миллион токенов.

от Контекст 1.00M36 ₽/Mвх216 ₽/Mвых

Qwen: Qwen3.6 Flash

Рассуждения

Qwen3.6 Flash — это быстрый и эффективный языковой модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов.

от Контекст 1.00M24 ₽/Mвх140 ₽/Mвых

Qwen: Qwen3.6 35B A3B

Рассуждения

Qwen3.6-35B-A3B — это мультимодальная модель с открытыми весами от Alibaba Cloud, содержащая 35 миллиардов параметров, из которых 3 миллиарда активируются для каждого токена. Модель использует гибридную разреженную архитектуру mixture-of-experts с механизмом Gated.

от Контекст 262K19 ₽/Mвх125 ₽/Mвых

Qwen: Qwen3.6 Max Preview

Рассуждения

Qwen3.6-Max-Preview — это собственная передовая модель Alibaba Cloud, построенная на архитектуре разреженного смешения экспертов с примерно 1 триллионом параметров. Она оптимизирована для агентного программирования, использования инструментов и других задач.

от Контекст 262K125 ₽/Mвх747 ₽/Mвых

Qwen: Qwen3.6 27B

Рассуждения

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров, разработанная командой Qwen из Alibaba и выпущенная в апреле 2026 года. Модель обладает гибридными мультимодальными возможностями — принимает на вход текст, изображения и видео.

от Контекст 262K39 ₽/Mвх383 ₽/Mвых

OpenAI: GPT-5.5 Pro

Рассуждения

GPT-5.5 Pro — это высокопроизводительная модель, разработанная для глубокого анализа и высокой точности при работе с комплексными и критически важными задачами. Модель поддерживает контекстное окно более 1 миллиона токенов (922 тысячи входных, 128 тысяч выходных).

от Контекст 1.05M3 312 ₽/Mвх19 872 ₽/Mвых

OpenAI: GPT-5.5

Рассуждения

GPT-5.5 — передовая модель, разработанная для сложных профессиональных задач, основанная на GPT-5.4 с улучшенными возможностями рассуждения, повышенной надежностью и улучшенной эффективностью обработки токенов при выполнении сложных заданий. Модель поддерживает работу с более чем 1 миллионом токенов.

от Контекст 1.05M575 ₽/Mвх3 450 ₽/Mвых

DeepSeek: DeepSeek V4 Pro

Рассуждения

DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window. It is designed for advanced reasoning, coding,...

от Контекст 1.05M55 ₽/Mвх109 ₽/Mвых

DeepSeek: DeepSeek V4 Flash (Бесплатно)

Рассуждения

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим числом параметров 284 миллиарда и 13 миллиардами активируемых параметров, поддерживающая контекстное окно в 1 миллион токенов. Модель разработана для быстрого вывода и...

от Контекст 1.05MБесплатновхБесплатновых

DeepSeek: DeepSeek V4 Flash

Рассуждения

#4 в рейтинге

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

от Контекст 1.05M14 ₽/Mвх28 ₽/Mвых

inclusionAI: Ling-2.6-1T

Ling-2.6-1T — это модель мгновенного (инструктивного) типа от inclusionAI, являющаяся флагманской моделью компании с триллионом параметров. Она разработана для реальных агентов, которым необходима быстрая обработка и высокая эффективность при масштабировании. Модель использует технологию ускоренного выполнения, обеспечивая оптимальное сочетание скорости и производительности.

от Контекст 262K36 ₽/Mвх299 ₽/Mвых

Tencent: Hy3 preview

Рассуждения

Hy3 preview — это высокоэффективная модель Mixture-of-Experts от Tencent, разработанная для агентных рабочих процессов и промышленного использования. Она поддерживает настраиваемые уровни рассуждений с режимами отключения, низким и высоким, что позволяет адаптировать работу модели под различные задачи.

от Контекст 262K9 ₽/Mвх33 ₽/Mвых

Xiaomi: MiMo-V2.5-Pro

Рассуждения

#16 в рейтинге

MiMo-V2.5-Pro — флагманская модель Xiaomi, демонстрирующая высокую производительность в общих агентных задачах, сложном программном инжиниринге и долгосрочных проектах, занимая лидирующие позиции в бенчмарках, таких как ClawEval, GDPVal и SWE-bench Pro.

от Контекст 1.05M120 ₽/Mвх359 ₽/Mвых

Xiaomi: MiMo-V2.5

Рассуждения

MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность уровня Pro для агентных задач примерно за половину стоимости вывода, при этом превосходя MiMo-V2-Omni в мультимодальном восприятии при анализе изображений и видео.

от Контекст 1.05M48 ₽/Mвх240 ₽/Mвых

OpenAI: GPT-5.4 Image 2

Рассуждения

GPT-5.4 Image 2 сочетает модель OpenAI GPT-5.4 с передовыми возможностями генерации изображений из GPT Image 2. Он обеспечивает богатые мультимодальные рабочие процессы, позволяя пользователям плавно переходить между рассуждениями, программированием и...

от Контекст 272K920 ₽/Mвх1 725 ₽/Mвых

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это мгновенная (инструктивная) модель от inclusionAI с общим числом параметров 104 миллиарда и активными параметрами 7,4 миллиарда, разработанная для реальных агентов, которым необходимы быстрые ответы, высокая производительность и эффективное использование токенов.

от Контекст 262K2 ₽/Mвх4 ₽/Mвых

Anthropic: Claude Opus Latest

Рассуждения

Эта модель всегда перенаправляет на последнюю модель из семейства Claude Opus.

от Контекст 1.00M575 ₽/Mвх2 875 ₽/Mвых

Pareto Code Router

Pareto Router — это способ, с помощью которого alltokens всегда выбирает для вас мощную модель для кодирования в соответствии с вашими потребностями, не привязываясь к конкретной модели. Вы выражаете единственное предпочтение `min_coding_score`...

от Контекст 2.00MБесплатновхБесплатновых

Baidu: Qianfan-OCR-Fast

Рассуждения

Qianfan-OCR-Fast — это специализированная мультимодальная крупная модель, созданная для оптического распознавания текста (OCR). Используя специализированные данные для обучения OCR и сохраняя при этом универсальный мультимодальный интеллект, она обеспечивает значительное улучшение производительности по сравнению с Qianfan-OCR.

от Контекст 66K82 ₽/Mвх337 ₽/Mвых

MoonshotAI: Kimi K2.6

Рассуждения

#10 в рейтинге

Kimi K2.6 — это мультимодальная модель следующего поколения от Moonshot AI, разработанная для долгосрочного кодирования, создания UI/UX на основе кода и мультиагентной оркестрации. Она управляет сложными комплексными задачами кодирования на Python, Rust и Go, а также...

от Контекст 262K88 ₽/Mвх418 ₽/Mвых

Каталог моделей AllTokens

Страница агрегирует актуальные LLM-модели с единым API-доступом, ценами в рублях и рабочими параметрами интеграции. Используйте фильтры ниже для подбора под качество, стоимость и ограничения по контексту.

Моделей в каталоге

381

Средняя цена входа

296,8 ₽/M

Максимальный контекст

2.0M

Недорогие модели для старта

inclusionAI: Ling-2.6-flash: 2 ₽/M IBM: Granite 4.1 8B: 7 ₽/M Tencent: Hy3 preview: 9 ₽/M inclusionAI: Ring-2.6-1T: 10 ₽/M DeepSeek: DeepSeek V4 Flash: 14 ₽/M Perceptron: Perceptron Mk1: 19 ₽/M

Модели с большим контекстом

Pareto Code Router: 2000K OpenAI GPT Latest: 1050K OpenAI: GPT-5.5 Pro: 1050K OpenAI: GPT-5.5: 1050K Owl Alpha: 1049K Google: Gemini 3.1 Flash Lite: 1049K

Модели

Anthropic: Claude Opus 4.7 (Fast)

Perceptron: Perceptron Mk1

inclusionAI: Ring-2.6-1T

Google: Gemini 3.1 Flash Lite

Baidu Qianfan: CoBuddy (Бесплатно)

Как выбрать AI-модель под задачу

OpenAI: GPT Chat Latest

xAI: Grok 4.3

IBM: Granite 4.1 8B

Mistral: Mistral Medium 3.5

Owl Alpha

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

Poolside: Laguna XS.2 (Бесплатно)

Poolside: Laguna M.1 (Бесплатно)

Anthropic Claude Haiku Latest

OpenAI GPT Mini Latest

Google Gemini Pro Latest

MoonshotAI Kimi Latest

Google Gemini Flash Latest

Anthropic Claude Sonnet Latest

OpenAI GPT Latest

Qwen: Qwen3.5 Plus 2026-04-20

Qwen: Qwen3.6 Flash

Qwen: Qwen3.6 35B A3B

Qwen: Qwen3.6 Max Preview

Qwen: Qwen3.6 27B

OpenAI: GPT-5.5 Pro

OpenAI: GPT-5.5

DeepSeek: DeepSeek V4 Pro

DeepSeek: DeepSeek V4 Flash (Бесплатно)

DeepSeek: DeepSeek V4 Flash

inclusionAI: Ling-2.6-1T

Tencent: Hy3 preview

Xiaomi: MiMo-V2.5-Pro

Xiaomi: MiMo-V2.5

OpenAI: GPT-5.4 Image 2

inclusionAI: Ling-2.6-flash

Anthropic: Claude Opus Latest

Pareto Code Router

Baidu: Qianfan-OCR-Fast

MoonshotAI: Kimi K2.6

Каталог моделей AllTokens

Похожие модели по цене

Похожие модели по API-параметрам

Недорогие модели для старта

Модели с большим контекстом

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

Модели

Anthropic: Claude Opus 4.7 (Fast)

Perceptron: Perceptron Mk1

inclusionAI: Ring-2.6-1T

Google: Gemini 3.1 Flash Lite

Baidu Qianfan: CoBuddy (Бесплатно)

Как выбрать AI-модель под задачу

OpenAI: GPT Chat Latest

xAI: Grok 4.3

IBM: Granite 4.1 8B

Mistral: Mistral Medium 3.5

Owl Alpha

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

Poolside: Laguna XS.2 (Бесплатно)

Poolside: Laguna M.1 (Бесплатно)

Anthropic Claude Haiku Latest

OpenAI GPT Mini Latest

Google Gemini Pro Latest

MoonshotAI Kimi Latest

Google Gemini Flash Latest

Anthropic Claude Sonnet Latest

OpenAI GPT Latest

Qwen: Qwen3.5 Plus 2026-04-20

Qwen: Qwen3.6 Flash

Qwen: Qwen3.6 35B A3B

Qwen: Qwen3.6 Max Preview

Qwen: Qwen3.6 27B