Alltokens

Мультимодальные AI-модели (текст, изображения, аудио, видео)

В этой группе собраны модели, которые умеют работать не только с текстом, но и с изображениями, аудио или видео. Это основа для мультимодальных ассистентов.

Моделей в подборке

60

Средняя цена (вход)

344 ₽/M

Макс. контекст

2.0M

Модели

alltokens

Auto Router

Рассуждения

Ваш запрос будет обработан мета-моделью и направлен в одну из десятков доступных моделей для достижения наилучшего результата. Чтобы узнать, какая именно модель была использована, проверьте историю активности или атрибут model в ответе API. Стоимость запроса соответствует тарифу выбранной модели. Вы можете настроить список моделей для маршрутизации в документации. Запросы направляются в следующие модели: - anthropic/claude-haiku-4.5 - anthropic/claude-opus-4.6 - anthropic/claude-sonnet-4.5 - deepseek/deepseek-r1 - google/gemini-2.5-flash-lite - google/gemini-3-flash-preview - google/gemini-3-pro-preview - meta-llama/llama-3.3-70b-instruct - mistralai/codestral-2508 - mistralai/mistral-large - mistralai/mistral-medium-3.1 - mistralai/mistral-small-3.2-24b-instruct-2506 - moonshotai/kimi-k2-thinking - moonshotai/kimi-k2.5 - openai/gpt-5 - openai/gpt-5-mini - openai/gpt-5-nano - openai/gpt-5.1 - openai/gpt-5.2 - openai/gpt-5.2-pro - openai/gpt-oss-120b - perplexity/sonar - qwen/qwen3-235b-a22b - x-ai/grok-3 - x-ai/grok-3-mini - x-ai/grok-4

от Контекст 2.00MБесплатновхБесплатновых
google

Google: Gemini 3.1 Flash Lite Preview

Рассуждения

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для задач с высоким объемом использования. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым возможностям. Улучшения охватывают аудиовход/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и завершение кода. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки компромисса между стоимостью и производительностью. Стоит в два раза дешевле Gemini 3 Flash.

от Контекст 1.05M34 ₽/Mвх201 ₽/Mвых
google

Google: Gemini 3.1 Pro Preview Custom Tools

Рассуждения

Gemini 3.1 Pro Preview Custom Tools — это специализированная версия модели Gemini 3.1 Pro, в которой оптимизирован механизм выбора инструментов. Модель реже использует стандартный bash-инструмент в тех случаях, когда доступны более эффективные сторонние или пользовательские функции. Этот предварительный эндпоинт на alltokens значительно повышает надежность вызова функций и гарантирует, что модель выберет наиболее подходящий инструмент в сценариях с кодинг-агентами и сложными рабочими процессами, включающими множество инструментов. Модель сохраняет все ключевые преимущества Gemini 3.1 Pro, включая мультимодальное рассуждение при работе с текстом, изображениями, видео, аудио и кодом, контекстное окно объемом 1 миллион токенов и высокую производительность в задачах разработки программного обеспечения.

от Контекст 1.05M229 ₽/Mвх1 369 ₽/Mвых
google

Google: Gemini 3.1 Pro Preview

Рассуждения

Gemini 3.1 Pro Preview — это передовая модель Google с расширенными возможностями рассуждения, обеспечивающая повышенную производительность в разработке программного обеспечения, надежность работы агентов и эффективное использование токенов в сложных рабочих процессах. Основанная на мультимодальной базе серии Gemini 3, она сочетает в себе высокоточное логическое мышление при работе с текстом, изображениями, видео, аудио и кодом с контекстным окном в 1 миллион токенов. При использовании многошагового вызова инструментов на alltokens необходимо сохранять детали рассуждений. Обновление 3.1 демонстрирует измеримый рост в тестах SWE и реальных средах программирования, а также более уверенное выполнение автономных задач в структурированных областях, таких как финансы и работа с электронными таблицами. Разработанная для продвинутой разработки и агентных систем, Gemini 3.1 Pro Preview улучшает стабильность при выполнении длительных задач и оркестрацию инструментов, одновременно повышая эффективность расхода токенов. В модели представлен новый средний уровень мышления для оптимального баланса стоимости, скорости и производительности. Модель отлично справляется с написанием кода через агентов, структурированным планированием, мультимодальным анализом и автоматизацией рабочих процессов, что делает ее подходящей для автономных агентов, финансового моделирования, автоматизации таблиц и корпоративных задач с большим объемом контекста.

от Контекст 1.05M229 ₽/Mвх1 369 ₽/Mвых
google

Google: Gemini 3 Flash Preview

Рассуждения

Gemini 3 Flash Preview — это высокоскоростная и эффективная модель с поддержкой логических рассуждений, разработанная для агентных рабочих процессов, многошаговых диалогов и помощи в написании кода. Она обеспечивает производительность в рассуждениях и использовании инструментов на уровне, близком к версии Pro, но с существенно меньшей задержкой, чем у более крупных вариантов Gemini. Это делает ее оптимальным выбором для интерактивной разработки, длительных циклов работы агентов и совместного программирования. По сравнению с Gemini 2.5 Flash, данная модель предлагает значительные улучшения в качестве логических выводов, мультимодальном понимании и надежности. Модель поддерживает контекстное окно объемом 1 миллион токенов и мультимодальные входные данные, включая текст, изображения, аудио, видео и PDF-файлы, с выводом в текстовом формате. Функционал включает настраиваемые уровни рассуждений (минимальный, низкий, средний, высокий), структурированный вывод, использование инструментов и автоматическое кэширование контекста. Gemini 3 Flash Preview оптимизирована для пользователей, которым требуются развитые способности к рассуждению и агентное поведение без затрат и задержек, характерных для полномасштабных флагманских моделей.

от Контекст 1.05M60 ₽/Mвх359 ₽/Mвых
google

Google: Gemini 2.5 Flash Lite Preview 09-2025

Рассуждения

Gemini 2.5 Flash-Lite — это облегченная модель рассуждений в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, более генерацию токенов и улучшенную производительность в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция мышления (многопроходное рассуждение) отключена для обеспечения максимальной скорости, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повышать уровень интеллекта модели за счет увеличения стоимости. На alltokens вы можете получить доступ к этой модели для интеграции в свои проекты.

от Контекст 1.05M14 ₽/Mвх54 ₽/Mвых
google

Google: Gemini 2.5 Flash Lite

Рассуждения

Gemini 2.5 Flash-Lite — это облегченная модель в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, ускоренную генерацию токенов и лучшие показатели в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция рассуждений отключена для обеспечения максимальной скорости работы, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повысить интеллектуальные возможности модели за счет увеличения стоимости. На платформе alltokens вы можете интегрировать данную модель в свои проекты.

от Контекст 1.05M14 ₽/Mвх54 ₽/Mвых
google

Google: Gemini 2.5 Flash

Рассуждения

Gemini 2.5 Flash — это передовая высокопроизводительная модель от Google, специально разработанная для сложного логического вывода, написания кода, решения математических и научных задач. Она оснащена встроенными механизмами рассуждения, что позволяет ей выдавать ответы с повышенной точностью и глубокой проработкой контекста. Кроме того, Gemini 2.5 Flash поддерживает настройку через параметр max tokens for reasoning, доступный в API alltokens.

от Контекст 1.05M36 ₽/Mвх299 ₽/Mвых
google

Google: Gemini 2.5 Pro

Рассуждения

Gemini 2.5 Pro — это современная модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического рассуждения, программирования, математики и естественных наук. Модель использует возможности глубокого мышления, что позволяет ей выстраивать цепочки рассуждений для достижения повышенной точности и тонкой работы с контекстом. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных тестах и занимает первое место в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем.

от Контекст 1.05M143 ₽/Mвх1 141 ₽/Mвых
google

Google: Gemini 2.5 Pro Preview 05-06

Рассуждения

Gemini 2.5 Pro — это передовая модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического мышления, программирования, математики и естественных наук. Модель использует возможности глубокого рассуждения, что позволяет ей выстраивать цепочки мыслей для достижения повышенной точности и тонкой обработки контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных бенчмарках и занимает первое место в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем. Доступ к модели осуществляется через API alltokens.

от Контекст 1.05M143 ₽/Mвх1 141 ₽/Mвых
google

Google: Gemini 2.0 Flash Lite

Удаляется 1 июня

Gemini 2.0 Flash Lite обеспечивает значительно более высокую скорость генерации первого токена (TTFT) по сравнению с Gemini Flash 1.5. При этом модель сохраняет качество работы на уровне более крупных решений, таких как Gemini Pro 1.5, предлагая максимально экономичную стоимость токенов.

от Контекст 1.05M11 ₽/Mвх41 ₽/Mвых
google

Google: Gemini 2.0 Flash

Удаляется 1 июня

Gemini Flash 2.0 обеспечивает значительно более высокую скорость генерации первого токена по сравнению с Gemini Flash 1.5, сохраняя при этом качество ответов на уровне более крупных моделей, таких как Gemini Pro 1.5. В этой версии представлены существенные улучшения в мультимодальном понимании, написании кода, следовании сложным инструкциям и вызове функций. Совокупность этих обновлений позволяет создавать более плавные и надежные сценарии работы автономных агентов через alltokens.

от Контекст 1.05M14 ₽/Mвх54 ₽/Mвых
google

Google: Gemini 2.5 Pro Preview 06-05

Рассуждения

Gemini 2.5 Pro — это современная модель искусственного интеллекта от Google, разработанная для решения сложных задач в области логического рассуждения, программирования, математики и естественных наук. Модель использует возможности глубокого мышления, что позволяет ей выстраивать цепочки рассуждений для достижения повышенной точности и тонкой обработки контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность в различных тестах и занимает лидирующие позиции в рейтинге LMArena, что подтверждает превосходное соответствие человеческим предпочтениям и выдающиеся способности к решению комплексных проблем. Доступ к модели осуществляется через API alltokens.

от Контекст 1.05M143 ₽/Mвх1 141 ₽/Mвых
amazon

Amazon: Nova 2 Lite

Рассуждения

Nova 2 Lite — это быстрая и экономичная модель рассуждения для повседневных задач, способная обрабатывать текст, изображения и видео для генерации текстовых ответов. Nova 2 Lite демонстрирует выдающиеся возможности в обработке документов, извлечении информации из видео, написании программного кода, предоставлении точных обоснованных ответов и автоматизации многоэтапных рабочих процессов с использованием агентов.

от Контекст 1.00M36 ₽/Mвх299 ₽/Mвых
xiaomi

Xiaomi: MiMo-V2-Omni

Рассуждения

MiMo-V2-Omni - это передовая омни-модель, которая нативно обрабатывает изображения, видео и аудио в единой архитектуре. Она сочетает в себе мощное мультимодальное восприятие с агентными возможностями - визуальную привязку, многошаговое планирование, использование инструментов и выполнение кода, что делает ее идеальной для сложных реальных задач, охватывающих различные модальности. Контекстное окно 256K.

от Контекст 262K48 ₽/Mвх240 ₽/Mвых
x-ai

xAI: Grok 4.20 Multi-Agent

РассужденияНовая

Grok 4.20 Multi-Agent — это вариант модели xAI Grok 4.20, созданный для совместной работы агентов. Несколько агентов работают параллельно для проведения глубоких исследований, координации использования инструментов и синтеза информации при решении сложных задач. Поведение при затратах на рассуждение: - низкое / среднее: 4 агента - высокое / очень высокое: 16 агентов

от Контекст 2.00M240 ₽/Mвх718 ₽/Mвых
x-ai

xAI: Grok 4.1 Fast

Рассуждения

Grok 4.1 Fast — это лучшая модель xAI для работы с агентами и вызова инструментов, которая демонстрирует превосходные результаты в реальных сценариях, таких как клиентская поддержка и глубокие исследования. Модель обладает контекстным окном объемом 2 миллиона токенов. Режим рассуждения можно включать или выключать с помощью параметра reasoning enabled в API.

от Контекст 2.00M27 ₽/Mвх67 ₽/Mвых
x-ai

xAI: Grok 4 Fast

Рассуждения

Grok 4 Fast — это новейшая мультимодальная модель от xAI, обладающая передовыми показателями экономической эффективности и контекстным окном в 2 миллиона токенов. Модель представлена в двух вариантах: стандартном и с поддержкой логических рассуждений. Функцию рассуждений можно включать или отключать с помощью параметра reasoning enabled в API alltokens.

от Контекст 2.00M27 ₽/Mвх67 ₽/Mвых
openai

OpenAI: GPT-5.4 Pro

Рассуждения

GPT-5.4 Pro — самая продвинутая модель OpenAI, построенная на унифицированной архитектуре GPT-5.4 с улучшенными способностями к рассуждению для сложных, критически важных задач. Она оснащена контекстным окном в 1M+ токенов (922K входных, 128K выходных) с поддержкой текстовых и изображений входных данных. Оптимизирована для пошагового рассуждения, следования инструкциям и точности, GPT-5.4 Pro отлично справляется с агентным кодированием, рабочими процессами с длинным контекстом и решением многошаговых задач.

от Контекст 1.05M3 312 ₽/Mвх19 872 ₽/Mвых
openai

OpenAI: GPT-5.4

Рассуждения

GPT-5.4 — это последняя флагманская модель OpenAI, объединяющая линии Codex и GPT в единую систему. Она оснащена контекстным окном более 1 млн токенов (922 тыс. входных, 128 тыс. выходных) и поддерживает текстовые и изображенные входные данные, что позволяет выполнять высококонтекстное рассуждение, программирование и мультимодальный анализ в рамках одного рабочего процесса. Модель демонстрирует улучшенные результаты в программировании, анализе документов, использовании инструментов и следовании инструкциям. Она разработана как надежный выбор как для общих задач, так и для разработки программного обеспечения, способна генерировать код промышленного качества, синтезировать информацию из множественных источников и выполнять сложные многошаговые рабочие процессы с меньшим количеством итераций и большей эффективностью использования токенов.

от Контекст 1.05M286 ₽/Mвх1 712 ₽/Mвых
openai

OpenAI: GPT-4.1

GPT-4.1 — это флагманская большая языковая модель, оптимизированная для точного следования сложным инструкциям, решения задач программной инженерии и рассуждений в рамках длинного контекста. Модель поддерживает контекстное окно объемом 1 миллион токенов и превосходит GPT-4o и GPT-4.5 в таких областях, как написание кода (54,6% на тесте SWE-bench Verified), соблюдение инструкций (87,4% на IFEval) и мультимодальное понимание. GPT-4.1 настроена для генерации точных правок кода, обеспечения надежной работы автономных агентов и высокого качества извлечения информации из объемных документов. Это делает ее идеальным решением для разработки ИИ-агентов, интеграции в инструменты разработки и корпоративного поиска знаний. На платформе alltokens модель доступна для интеграции в любые рабочие процессы.

от Контекст 1.05M240 ₽/Mвх957 ₽/Mвых
openai

OpenAI: GPT-4.1 Mini

GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, сопоставимую с GPT-4o, при значительно меньших задержках и стоимости. Она поддерживает контекстное окно в 1 миллион токенов и демонстрирует высокие результаты в тестах: 45,1% в сложных проверках на следование инструкциям, 35,8% в MultiChallenge и 84,1% в IFEval. Модель Mini также обладает развитыми способностями к программированию, что подтверждается результатом 31,6% в бенчмарке Aider polyglot diff, и уверенным пониманием визуального контента. Это делает её подходящим решением для интерактивных приложений с жесткими требованиями к производительности. Доступ к модели осуществляется через alltokens.

от Контекст 1.05M48 ₽/Mвх192 ₽/Mвых
openai

OpenAI: GPT-4.1 Nano

Для задач, требующих минимальной задержки, GPT-4.1 nano является самой быстрой и доступной моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при компактном размере и обладает контекстным окном в 1 миллион токенов. Модель демонстрирует высокие показатели в тестах: 80,1% в MMLU, 50,3% в GPQA и 9,8% в Aider polyglot coding, что превосходит результаты GPT-4o mini. Это идеальное решение для таких задач, как классификация или автодополнение текста. На alltokens вы можете получить доступ к этой модели через API.

от Контекст 1.05M14 ₽/Mвх54 ₽/Mвых
qwen

Qwen: Qwen3.6 Plus (Бесплатно)

РассужденияНовая
#11 в рейтинге

Qwen 3.6 Plus основан на гибридной архитектуре, сочетающей эффективное линейное внимание с разреженным маршрутизатором смеси экспертов, что обеспечивает высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, модель демонстрирует значительный прирост в агентном кодировании, разработке фронтенда и общем рассуждении, а также улучшенный опыт "vibe coding". Модель отлично справляется с сложными задачами, такими как 3D-сцены, игры и решение проблем на уровне репозиториев, достигая 78.8 баллов на SWE-bench Verified. Это представляет собой существенный скачок как в чисто текстовых, так и в мультимодальных возможностях, показывая результаты на уровне ведущих современных моделей.

от Контекст 1.00MБесплатновхБесплатновых
qwen

Qwen: Qwen3.5-Flash

Рассуждения

Модели Qwen3.5 Flash с нативной поддержкой визуально-языковых задач построены на гибридной архитектуре, объединяющей механизм линейного внимания с разреженной моделью смеси экспертов, что обеспечивает более высокую эффективность логического вывода. По сравнению с третьей серией, эти модели демонстрируют качественный скачок производительности как в текстовых, так и в мультимодальных задачах, обеспечивая быстрый отклик при оптимальном балансе скорости генерации и общего качества работы.

от Контекст 1.00M9 ₽/Mвх35 ₽/Mвых
qwen

Qwen: Qwen3.5 Plus 2026-02-15

Рассуждения

Серия мультимодальных моделей Qwen3.5 Plus построена на гибридной архитектуре, которая объединяет механизмы линейного внимания с разреженными моделями смеси экспертов (MoE), что обеспечивает более высокую эффективность логического вывода. В ходе оценки различных задач серия 3.5 стабильно демонстрирует производительность на уровне ведущих современных моделей. По сравнению с третьей серией, эти модели представляют собой значительный качественный скачок как в обработке чисто текстовых данных, так и в мультимодальных возможностях.

от Контекст 1.00M35 ₽/Mвх209 ₽/Mвых
anthropic

Anthropic: Claude Sonnet 4.5

Рассуждения

Claude Sonnet 4.5 — это самая совершенная модель в линейке Sonnet от Anthropic на сегодняшний день, оптимизированная для работы автономных агентов и процессов разработки ПО. Она демонстрирует передовую производительность в тестах программирования, таких как SWE-bench Verified, показывая значительные улучшения в проектировании систем, безопасности кода и соблюдении спецификаций. Модель разработана для длительной автономной работы, обеспечивая непрерывность выполнения задач между сессиями и предоставляя отчеты о прогрессе на основе фактов. Sonnet 4.5 также внедряет расширенные агентные возможности, включая улучшенную оркестрацию инструментов, спекулятивное параллельное выполнение, а также более эффективное управление контекстом и памятью. Благодаря улучшенному отслеживанию контекста и контролю использования токенов при вызовах инструментов, модель особенно эффективна для многозадачных и длительных рабочих процессов. Сферы применения охватывают программную инженерию, кибербезопасность, финансовый анализ, исследовательских агентов и другие области, требующие глубоких рассуждений и активного использования внешних инструментов.

от Контекст 1.00M343 ₽/Mвх1 712 ₽/Mвых
openai

OpenAI: GPT-5.4 Nano

Рассуждения

GPT-5.4 nano — это самая легкая и экономичная версия семейства GPT-5.4, оптимизированная для задач, требующих высокой скорости и обработки больших объемов данных. Модель поддерживает текстовые и изображенческие входные данные и предназначена для использования в случаях, где критична низкая задержка, таких как классификация, извлечение данных, ранжирование и выполнение подагентов. Модель делает упор на быстроту отклика и эффективность, а не на глубокое рассуждение, что делает ее идеальной для пайплайнов, требующих быстрых и надежных результатов в больших масштабах. GPT-5.4 nano отлично подходит для фоновых задач, систем реального времени и распределенных архитектур агентов, где минимизация затрат и задержек имеет первостепенное значение.

от Контекст 400K27 ₽/Mвх167 ₽/Mвых
openai

OpenAI: GPT-5.4 Mini

Рассуждения

GPT-5.4 mini предлагает основные возможности GPT-5.4 в более быстрой и эффективной модели, оптимизированной для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и изображения входные данные с высокой производительностью в рассуждениях, программировании и использовании инструментов, при этом снижая задержку и стоимость для крупномасштабных развертываний. Модель разработана для производственных сред, требующих баланса между возможностями и эффективностью, что делает ее отличным выбором для чат-приложений, программистских ассистентов и агентских рабочих процессов, работающих в масштабе. GPT-5.4 mini обеспечивает надежное следование инструкциям, солидное многошаговое рассуждение и стабильную производительность по разнообразным задачам с улучшенной экономичностью.

от Контекст 400K90 ₽/Mвх539 ₽/Mвых
openai

OpenAI: GPT-5.3-Codex

Рассуждения

GPT-5.3-Codex — это самая совершенная агентная модель OpenAI для написания кода, объединяющая передовую производительность в области программной инженерии GPT-5.2-Codex с расширенными возможностями рассуждения и профессиональными знаниями GPT-5.2. Модель демонстрирует лучшие в отрасли результаты в тестах SWE-Bench Pro, а также высокие показатели в Terminal-Bench 2.0 и OSWorld-Verified, что подтверждает улучшенные навыки многоязычного программирования, владения терминалом и взаимодействия с компьютерной средой в реальных условиях. Модель оптимизирована для длительных рабочих процессов с использованием инструментов и поддерживает интерактивное управление во время выполнения, что делает ее подходящей для сложных задач разработки, отладки, развертывания и итеративной работы над продуктом. Помимо программирования, GPT-5.3-Codex показывает отличные результаты в бенчмарках для структурированной интеллектуальной работы, таких как GDPval, поддерживая такие задачи, как составление документов, анализ электронных таблиц, создание презентаций и операционные исследования в различных областях. Модель обучена с повышенным вниманием к кибербезопасности, включая возможности выявления уязвимостей, и развернута с дополнительными мерами защиты для сценариев использования с высоким уровнем риска. По сравнению с предыдущими моделями Codex, она более эффективна в расходе токенов и работает примерно на 25% быстрее, ориентируясь на профессиональные сквозные рабочие процессы, охватывающие логические рассуждения, выполнение кода и взаимодействие с компьютером.

от Контекст 400K200 ₽/Mвх1 598 ₽/Mвых
openai

OpenAI: GPT-5.2 Pro

Рассуждения

GPT-5.2 Pro — самая продвинутая модель от OpenAI, предлагающая значительные улучшения в агентном программировании и работе с длинным контекстом по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих пошаговых рассуждений, строгого следования инструкциям и высокой точности в критически важных сценариях использования. Модель поддерживает функции маршрутизации во время выполнения запроса и продвинутое понимание намерений пользователя, включая специфические указания вроде «тщательно обдумай это». Улучшения включают снижение уровня галлюцинаций и склонности к поддакиванию, а также повышение производительности в написании кода, создании текстов и решении задач, связанных со здравоохранением.

от Контекст 400K2 319 ₽/Mвх18 548 ₽/Mвых
openai

OpenAI: GPT-5.2

Рассуждения

GPT-5.2 — это новейшая модель флагманского уровня в серии GPT-5, обеспечивающая более высокую производительность в работе агентов и обработке длинного контекста по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического распределения вычислительных ресурсов, мгновенно отвечая на простые запросы и углубляясь в анализ при выполнении сложных задач. Разработанная для широкого спектра задач, GPT-5.2 демонстрирует стабильный рост показателей в математике, программировании, науке и вызове инструментов. Модель отличается более связными развернутыми ответами и повышенной надежностью при использовании внешних инструментов через API.

от Контекст 400K200 ₽/Mвх1 598 ₽/Mвых
openai

OpenAI: GPT-5.1

Рассуждения

GPT-5.1 — это новейшая модель флагманского уровня в серии GPT-5, предлагающая более мощные возможности логического вывода, улучшенное следование инструкциям и более естественный стиль общения по сравнению с GPT-5. Она использует адаптивное мышление для динамического распределения вычислительных ресурсов, мгновенно отвечая на простые запросы и уделяя больше времени глубокой проработке сложных задач. Модель формирует более четкие и обоснованные объяснения с меньшим количеством жаргона, что упрощает восприятие технических или многоэтапных решений. Разработанная для широкого спектра задач, GPT-5.1 демонстрирует стабильный рост производительности в математике, программировании и структурном анализе, обеспечивая связные развернутые ответы и повышенную надежность при работе с инструментами. Модель также отличается улучшенной настройкой диалогового взаимодействия, что позволяет получать более теплые и интуитивно понятные ответы без потери точности. GPT-5.1 является основным полнофункциональным преемником GPT-5 на платформе alltokens.

от Контекст 400K143 ₽/Mвх1 141 ₽/Mвых
openai

OpenAI: GPT-5 Image Mini

Рассуждения

GPT-5 Image Mini объединяет передовые языковые возможности GPT-5 Mini с технологией GPT Image 1 Mini для эффективной генерации изображений. Эта нативно мультимодальная модель отличается превосходным следованием инструкциям, качественным рендерингом текста и детальным редактированием изображений при сниженных задержках и стоимости. Она отлично справляется с созданием высококачественного визуального контента, сохраняя при этом глубокое понимание текста, что делает ее идеальным решением для масштабируемых приложений, требующих одновременной обработки текста и генерации графики.

от Контекст 400K299 ₽/Mвх240 ₽/Mвых
openai

OpenAI: GPT-5 Image

Рассуждения

GPT-5 Image объединяет модель GPT-5 от OpenAI с передовыми возможностями генерации изображений. Она предлагает значительные улучшения в логических рассуждениях, качестве написания кода и пользовательском опыте. Модель унаследовала лучшие черты GPT Image 1: превосходное следование инструкциям, качественный рендеринг текста и возможность детального редактирования изображений.

от Контекст 400K1 141 ₽/Mвх1 141 ₽/Mвых
openai

OpenAI: GPT-5 Pro

Рассуждения

GPT-5 Pro — это самая продвинутая модель от OpenAI, предлагающая значительные улучшения в логическом мышлении, качестве кода и пользовательском опыте. Она оптимизирована для решения сложных задач, требующих пошаговых рассуждений, строгого следования инструкциям и высокой точности в критически важных сценариях использования. Модель поддерживает функции маршрутизации во время выполнения запроса и продвинутое понимание контекста, включая специфические указания пользователя, такие как требование глубокого анализа проблемы. Улучшения включают снижение уровня галлюцинаций и склонности к поддакиванию, а также повышение производительности в программировании, написании текстов и задачах, связанных со сферой здравоохранения. На alltokens вы можете получить доступ к этой модели через API.

от Контекст 400K1 656 ₽/Mвх13 248 ₽/Mвых
openai

OpenAI: GPT-5

Рассуждения

GPT-5 — самая продвинутая модель от OpenAI, предлагающая значительные улучшения в логических рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошагового мышления, строгого следования инструкциям и высокой точности в критически важных сценариях. Модель поддерживает функции маршрутизации во время выполнения запроса и продвинутое понимание контекста, включая специфические указания пользователя, такие как требование глубокого анализа проблемы. Улучшения включают снижение уровня галлюцинаций и склонности к поддакиванию, а также повышенную производительность в программировании, написании текстов и задачах, связанных со сферой здравоохранения. На платформе alltokens вы можете получить доступ к возможностям этой модели через единый интерфейс.

от Контекст 400K143 ₽/Mвх1 141 ₽/Mвых
openai

OpenAI: GPT-5 Mini

Рассуждения

GPT-5 Mini — это компактная версия GPT-5, разработанная для решения менее ресурсоемких задач, требующих логического мышления. Модель обеспечивает те же преимущества в точности следования инструкциям и безопасности, что и основная версия GPT-5, но отличается сниженной задержкой и меньшей стоимостью. GPT-5 Mini является преемником модели o4-mini.

от Контекст 400K30 ₽/Mвх240 ₽/Mвых
openai

OpenAI: GPT-5 Nano

Рассуждения

GPT-5-Nano — это самая компактная и быстрая версия в семействе GPT-5, оптимизированная для инструментов разработки, мгновенного взаимодействия и сред с минимальной задержкой. Несмотря на ограниченную глубину рассуждений по сравнению со старшими моделями, она сохраняет ключевые возможности следования инструкциям и функции безопасности. Являясь преемником GPT-4.1-nano, эта модель представляет собой легковесное решение для приложений, чувствительных к стоимости ресурсов или работающих в режиме реального времени.

от Контекст 400K7 ₽/Mвх54 ₽/Mвых
google

Google: Gemma 4 26B A4B

РассужденияНовая

Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференсе активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели, при значительно меньших вычислительных затратах. Поддерживает мультимодальные входные данные, включая текст, изображения и видео (до 60 секунд с частотой 1 кадр в секунду). Оснащена 256K контекстным окном, встроенным вызовом функций, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.

от Контекст 262K18 ₽/Mвх54 ₽/Mвых
google

Google: Gemma 4 31B

РассужденияНовая

Gemma 4 31B Instruct — это мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая текстовые и изображений входные данные с текстовым выводом. Оснащена 256K контекстным окном, настраиваемым режимом мышления/рассуждения, встроенным вызовом функций и многоязычной поддержкой более 140 языков. Отлично справляется с программированием, рассуждениями и пониманием документов. Распространяется под лицензией Apache 2.0.

от Контекст 262K19 ₽/Mвх54 ₽/Mвых
bytedance-seed

ByteDance Seed: Seed-2.0-Lite

Рассуждения

Seed-2.0-Lite — это сбалансированная модель, разработанная для высокочастотных корпоративных нагрузок, оптимизированная как по производительности, так и по стоимости. Ее общая производительность превосходит предыдущее поколение Seed-1.8. Модель идеально подходит для производственных задач, таких как обработка неструктурированной информации, создание текстового контента, поиск и рекомендации, а также анализ данных. Модель поддерживает обработку длинного контекста, объединение информации из нескольких источников, выполнение многошаговых инструкций и высококачественные структурированные выходные данные — обеспечивая стабильное качество при значительном снижении затрат.

от Контекст 262K30 ₽/Mвх240 ₽/Mвых
bytedance-seed

ByteDance Seed: Seed-2.0-Mini

Рассуждения

Seed-2.0-mini ориентирована на сценарии с высокими требованиями к задержке, высокой интенсивности запросов и чувствительностью к затратам, делая упор на быстрый отклик и гибкое развертывание логического вывода. Модель обеспечивает производительность, сопоставимую с ByteDance-Seed-1.6, поддерживает контекстное окно 256k, четыре режима глубины рассуждений reasoning_effort (minimal, low, medium, high) и мультимодальное понимание. Она оптимизирована для легких задач, где приоритет отдается стоимости и скорости. Доступ к модели осуществляется через alltokens.

от Контекст 262K14 ₽/Mвх54 ₽/Mвых
qwen

Qwen: Qwen3.5-35B-A3B

Рассуждения

Серия Qwen3.5 35B-A3B представляет собой нативную мультимодальную модель для работы с текстом и изображениями. Она построена на гибридной архитектуре, объединяющей механизмы линейного внимания и разреженную структуру смеси экспертов, что обеспечивает повышенную эффективность при генерации ответов. По общему уровню производительности модель сопоставима с версией Qwen3.5-27B. На платформе alltokens данная модель доступна для интеграции через API.

от Контекст 262K22 ₽/Mвх174 ₽/Mвых
qwen

Qwen: Qwen3.5-27B

Рассуждения

Нативная визуально-языковая плотная модель Qwen3.5 27B использует механизм линейного внимания, что обеспечивает высокую скорость отклика при сохранении баланса между производительностью и быстродействием инференса. По своим общим возможностям модель сопоставима с Qwen3.5-122B-A10B. На платформе alltokens вы можете получить доступ к этому решению для эффективной обработки данных.

от Контекст 262K27 ₽/Mвх209 ₽/Mвых
qwen

Qwen: Qwen3.5-122B-A10B

Рассуждения

Qwen3.5 122B-A10B — это нативная мультимодальная модель, построенная на гибридной архитектуре, которая сочетает механизм линейного внимания с разреженной структурой смеси экспертов для повышения эффективности логического вывода. По общей производительности данная модель уступает только флагманской версии Qwen3.5-397B-A17B. Ее возможности работы с текстом значительно превосходят показатели Qwen3-235B-2507, а навыки визуального анализа и обработки изображений выше, чем у Qwen3-VL-235B. Модель доступна через API alltokens.

от Контекст 262K32 ₽/Mвх249 ₽/Mвых
qwen

Qwen: Qwen3.5 397B A17B

Рассуждения

Серия моделей Qwen3.5 397B-A17B — это нативная мультимодальная модель, построенная на гибридной архитектуре, которая сочетает механизм линейного внимания с разреженной структурой смеси экспертов (MoE) для достижения высокой эффективности логического вывода. Модель демонстрирует передовую производительность, сопоставимую с ведущими решениями в широком спектре задач, включая понимание естественного языка, логическое рассуждение, генерацию программного кода, работу автономных агентов, а также анализ изображений, видео и взаимодействие с графическими пользовательскими интерфейсами (GUI). Благодаря развитым навыкам написания кода и работы в режиме агента, модель обладает высокой способностью к обобщению в различных сценариях использования. На alltokens вы можете получить доступ к этой модели через единый API.

от Контекст 262K47 ₽/Mвх280 ₽/Mвых
bytedance-seed

ByteDance Seed: Seed 1.6 Flash

Рассуждения

Seed 1.6 Flash — это сверхбыстрая мультимодальная модель с глубоким мышлением от ByteDance Seed, поддерживающая работу как с текстом, так и с визуальными данными. Модель обладает контекстным окном объемом 256k токенов и способна генерировать ответы длиной до 16k токенов. Доступ к модели осуществляется через alltokens.

от Контекст 262K11 ₽/Mвх41 ₽/Mвых
bytedance-seed

ByteDance Seed: Seed 1.6

Рассуждения

Seed 1.6 — это универсальная модель общего назначения, разработанная командой ByteDance Seed. Она сочетает в себе мультимодальные возможности и адаптивное глубокое мышление, поддерживая контекстное окно объемом 256K токенов. Модель доступна через API alltokens.

от Контекст 262K30 ₽/Mвх240 ₽/Mвых
qwen

Qwen: Qwen3.5-9B

Рассуждения

Qwen3.5-9B — это мультимодальная фундаментальная модель из семейства Qwen3.5, разработанная для обеспечения сильных способностей к рассуждению, программированию и визуальному пониманию в эффективной архитектуре с 9 миллиардами параметров. Она использует унифицированную архитектуру для обработки зрения и языка с ранней фузией мультимодальных токенов, что позволяет модели обрабатывать и рассуждать над текстом и изображениями в рамках одного контекста.

от Контекст 256K7 ₽/Mвх21 ₽/Mвых
x-ai

xAI: Grok 4

Рассуждения

Grok 4 — это новейшая модель рассуждения от xAI с контекстным окном 256k токенов. Она поддерживает параллельный вызов инструментов, структурированные выходные данные, а также обработку текстовых и визуальных входных данных. Обратите внимание, что процесс рассуждения не отображается, его нельзя отключить, а интенсивность рассуждений не подлежит настройке. Стоимость использования увеличивается, если общее количество токенов в одном запросе превышает 128k. Подробную информацию можно найти в документации на alltokens.

от Контекст 256K343 ₽/Mвх1 712 ₽/Mвых
z-ai

Z.ai: GLM 5V Turbo

РассужденияНовая

GLM-5V-Turbo — это первая собственная мультимодальная базовая модель агента от Z.ai, созданная для визуального кодирования и задач, управляемых агентами. Она нативно обрабатывает изображения, видео и текстовые входы, отлично справляется с долгосрочным планированием, сложным кодированием и выполнением задач, а также работает безотказно с агентами для завершения полного цикла «восприятие → планирование → выполнение».

от Контекст 203K144 ₽/Mвх479 ₽/Mвых
anthropic

Anthropic: Claude Opus 4.5

Рассуждения

Claude 4.5 Opus — это флагманская модель Anthropic с продвинутыми способностями к рассуждению, оптимизированная для сложной программной инженерии, агентных рабочих процессов и длительного автономного использования компьютера. Модель обладает мощными мультимодальными возможностями, демонстрирует конкурентные результаты в тестах на программирование и логику, а также отличается повышенной устойчивостью к инъекциям в промпты. Архитектура модели позволяет эффективно работать на разных уровнях сложности, давая разработчикам возможность балансировать между скоростью, глубиной проработки и расходом токенов в зависимости от задач. Для управления эффективностью генерации доступен специальный параметр Verbosity на платформе alltokens с опциями low, medium или high. Opus 4.5 поддерживает продвинутое использование инструментов, управление расширенным контекстом и координацию мультиагентных систем, что делает модель идеальной для автономных исследований, отладки кода, многоэтапного планирования и манипуляций с электронными таблицами или браузером. По сравнению с предыдущими поколениями Opus, данная версия обеспечивает значительный прирост в структурированном мышлении, надежности выполнения команд и точности следования инструкциям, одновременно снижая накладные расходы токенов и повышая производительность в длительных задачах.

от Контекст 200K571 ₽/Mвх2 852 ₽/Mвых
openai

OpenAI: o3 Deep Research

Рассуждения

o3-deep-research — это продвинутая модель от OpenAI, предназначенная для глубоких исследований и решения сложных многоэтапных исследовательских задач. Примечание: данная модель всегда использует инструмент веб-поиска, что влечет за собой дополнительные расходы.

от Контекст 200K1 104 ₽/Mвх4 416 ₽/Mвых
openai

OpenAI: o4 Mini Deep Research

Рассуждения

o4-mini-deep-research — это более быстрая и доступная модель OpenAI для глубокого поиска, идеально подходящая для решения сложных многоэтапных исследовательских задач. Примечание: данная модель всегда использует инструмент веб-поиска, что влечет за собой дополнительные расходы.

от Контекст 200K240 ₽/Mвх957 ₽/Mвых
anthropic

Anthropic: Claude Opus 4.1

Рассуждения

Claude Opus 4.1 — это обновленная версия флагманской модели, обеспечивающая повышенную производительность в программировании, логических рассуждениях и выполнении агентных задач. Модель достигает показателя 74,5% в тесте SWE-bench Verified и демонстрирует значительные успехи в рефакторинге многофайлового кода, точности отладки и детализированном анализе. Поддерживается режим расширенного мышления до 64K токенов. Модель оптимизирована для задач, связанных с исследованиями, анализом данных и логическим выводом с использованием внешних инструментов. Все возможности доступны через API alltokens.

от Контекст 200K1 656 ₽/Mвх8 280 ₽/Mвых
openai

OpenAI: o3 Pro

Рассуждения

Модели серии o обучены с использованием обучения с подкреплением, что позволяет им обдумывать ответы перед их выводом и выполнять сложные логические рассуждения. Модель o3-pro задействует больше вычислительных мощностей для более глубокого анализа, обеспечивая стабильно более качественные результаты. Обратите внимание, что для работы с этой моделью на alltokens требуется использование собственного API-ключа.

от Контекст 200K2 208 ₽/Mвх8 832 ₽/Mвых
anthropic

Anthropic: Claude Opus 4

Рассуждения

Claude Opus 4 на момент выпуска признана лучшей в мире моделью для написания кода, обеспечивающей стабильную производительность при выполнении сложных, длительных задач и агентских рабочих процессов. Она устанавливает новые стандарты в программной инженерии, достигая лидирующих результатов в тестах SWE-bench (72,5%) и Terminal-bench (43,2%). Opus 4 поддерживает расширенные автономные сценарии, обрабатывая тысячи шагов задачи непрерывно в течение нескольких часов без потери качества. Все возможности модели доступны через API alltokens.

от Контекст 200K1 656 ₽/Mвх8 280 ₽/Mвых
anthropic

Anthropic: Claude Sonnet 4

Рассуждения

Claude Sonnet 4 значительно расширяет возможности своего предшественника Sonnet 3.7, демонстрируя превосходные результаты в задачах программирования и логического вывода с повышенной точностью и управляемостью. Достигнув рекордных показателей в тесте SWE-bench (72,7%), Sonnet 4 обеспечивает баланс между производительностью и вычислительной эффективностью. Это делает модель подходящей для широкого спектра задач: от повседневного написания кода до сложных проектов по разработке программного обеспечения. Ключевые улучшения включают усовершенствованную автономную навигацию по кодовой базе, снижение частоты ошибок в рабочих процессах с использованием агентов и повышенную надежность при выполнении сложных инструкций. Sonnet 4 оптимизирована для практического ежедневного использования, предоставляя передовые возможности рассуждения при сохранении высокой скорости отклика в различных сценариях работы. Все возможности модели доступны через API alltokens.

от Контекст 200K343 ₽/Mвх1 712 ₽/Mвых
openai

OpenAI: o4 Mini High

Рассуждения

OpenAI o4-mini-high — это та же модель o4-mini, но с параметром reasoning_effort, установленным на значение high. OpenAI o4-mini — это компактная модель рассуждений в серии o, оптимизированная для быстрой и экономичной работы при сохранении мощных мультимодальных и агентских возможностей. Она поддерживает использование инструментов и демонстрирует конкурентоспособные результаты в логических задачах и программировании на таких тестах, как AIME (99,5% с использованием Python) и SWE-bench, превосходя свою предшественницу o3-mini и даже приближаясь к o3 в некоторых областях. Несмотря на меньший размер, o4-mini показывает высокую точность в задачах STEM, визуальном решении проблем и редактировании кода. Она особенно хорошо подходит для сценариев с высокой пропускной способностью, где критически важны задержка или стоимость. Благодаря эффективной архитектуре и усовершенствованному обучению с подкреплением, o4-mini может выстраивать цепочки инструментов, генерировать структурированные ответы и решать многоэтапные задачи с минимальной задержкой — часто менее чем за минуту. На alltokens вы можете получить доступ к этой модели через API.

от Контекст 200K132 ₽/Mвх527 ₽/Mвых

Похожие модели внутри подборки

Быстрые связки для углубленного сравнения: по цене, контексту и поддерживаемым API-параметрам.

FAQ

Как понять, что модель мультимодальная?

Проверьте `inputModalities`: если там несколько модальностей (например, text+image), модель подходит для multimodal-задач.

Мультимодальные модели дороже?

Часто да, но многое зависит от провайдера и конкретной модели. Сравнивайте цены в каталоге перед запуском.

Смежные подборки

Лучшие для задач

Новости по теме

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.