Новости

Новые модели, обновления цен и улучшения возможностей.

Подборки моделей

OpenAI модели Anthropic модели Google Gemini модели Модели для программирования Недорогие модели Модели с длинным контекстом Мультимодальные модели

Сначала новые Сначала дешёвые Кодинг Мультимодальные

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Luna Pro

GPT-5.6 Luna Pro — это продвинутая версия модели Luna с активированным режимом глубокого рассуждения для решения сложнейших задач. Она поддерживает мультимодальный ввод данных и обладает внушительным контекстным окном в 1,05 миллиона токенов.

Вход: 60 ₽/MВыход: 359 ₽/M

ТехнологииНаука+2

Читать →

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Luna

GPT-5.6 Luna — это высокопроизводительная модель от OpenAI, оптимизированная для задач с жесткими требованиями к скорости отклика. Она сочетает в себе продвинутые возможности рассуждения и огромный контекстный сектор, что делает её идеальной для обработки больших массивов данных и сложных агентских сценариев.

Вход: 60 ₽/MВыход: 359 ₽/M

ТехнологииМаркетинг+2

Читать →

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Terra Pro

GPT-5.6 Terra Pro — это продвинутая версия модели Terra с активированным режимом глубокого рассуждения для решения сложнейших задач. Она поддерживает мультимодальный ввод данных, включая изображения и файлы, и обладает внушительным контекстным окном в 1 миллион токенов.

Вход: 150 ₽/MВыход: 897 ₽/M

ТехнологииНаука+3

Читать →

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Terra

GPT-5.6 Terra представляет собой сбалансированное решение в линейке OpenAI, сочетающее высокую производительность с продвинутыми возможностями рассуждения. Модель оптимизирована для повседневного программирования, работы с мультимодальными данными и выполнения сложных агентских задач.

Вход: 150 ₽/MВыход: 897 ₽/M

ПрограммированиеТехнологии+2

Читать →

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Sol Pro

GPT-5.6 Sol Pro — это продвинутая версия модели Sol, работающая в специальном режиме глубоких рассуждений для решения сложнейших задач. Благодаря огромному контекстному окну и поддержке мультимодального ввода, она идеально подходит для анализа масштабных документов и разработки комплексных ИТ-архитектур.

Вход: 288 ₽/MВыход: 1 725 ₽/M

ПрограммированиеТехнологии+3

Читать →

Openai09 июля 2026 г.

OpenAI: GPT-5.6 Sol

GPT-5.6 Sol — это флагманская мультимодальная модель, оптимизированная для сложного логического вывода и автономных агентных рабочих процессов. Она демонстрирует исключительную эффективность в многошаговом программировании и работе с командной строкой, поддерживая контекст до 1 миллиона токенов.

Вход: 288 ₽/MВыход: 1 725 ₽/M

ПрограммированиеТехнологии+3

Читать →

X-ai08 июля 2026 г.

xAI: Grok 4.5

Grok 4.5 — это флагманская модель от xAI, демонстрирующая передовые возможности в области программирования, науки и сложных интеллектуальных задач. Благодаря поддержке мультимодальности и огромному контекстному окну в 500 000 токенов, она эффективно справляется с анализом объемных документов и изображений.

Вход: 240 ₽/MВыход: 718 ₽/M

ПрограммированиеТехнологии+2

Читать →

Aion-labs07 июля 2026 г.

AionLabs: Aion-3.0-Mini

Aion-3.0-Mini — это специализированная мультимодельная система от AionLabs, построенная на базе архитектуры DeepSeek. Модель использует процесс совместной генерации несколькими специализированными агентами для достижения высокого качества в творческих задачах.

Вход: 84 ₽/MВыход: 168 ₽/M

Ролевые сценарииТехнологии+2

Читать →

Aion-labs07 июля 2026 г.

AionLabs: Aion-3.0

Aion-3.0 — это специализированная мультимодельная система, разработанная на базе семейства GLM для глубокого погружения в ролевой отыгрыш и создание сложных литературных сюжетов. Благодаря совместной работе нескольких специализированных агентов, модель обеспечивает высокую связность повествования и детальную проработку персонажей.

Вход: 359 ₽/MВыход: 718 ₽/M

Ролевые сценарииПеревод+1

Читать →

Tencent06 июля 2026 г.

Tencent: Hy3

Tencent Hy3 — это мощная модель на архитектуре Mixture-of-Experts с 295 миллиардами параметров, оптимизированная для сложных рассуждений и работы в качестве ИИ-агента. Благодаря поддержке настраиваемого уровня логических размышлений и огромному контекстному окну, она эффективно справляется с масштабными производственными задачами.

Вход: 18 ₽/MВыход: 73 ₽/M

ТехнологииПрограммирование+2

Читать →

Tencent06 июля 2026 г.

Tencent: Hy3 (Бесплатно)

Hy3 — это мощная модель от Tencent с архитектурой Mixture-of-Experts, насчитывающая 295 миллиардов параметров. Она специально оптимизирована для сложных логических рассуждений, агентных сценариев и промышленного использования благодаря поддержке настраиваемого уровня «усилий» при поиске решений.

Вход: — ₽/MВыход: — ₽/M

ПрограммированиеТехнологии+2

Читать →

Poolside02 июля 2026 г.

Poolside: Laguna XS 2.1 (Бесплатно)

Laguna XS 2.1 — это специализированная модель для программирования в категории 33B-A3B, предлагающая значительные улучшения по сравнению с предыдущими версиями. Благодаря контекстному окну в 262 144 токена, она эффективно справляется с анализом крупных кодовых баз и сложными задачами разработки.

Вход: — ₽/MВыход: — ₽/M

ПрограммированиеТехнологии+1

Читать →

Poolside02 июля 2026 г.

Poolside: Laguna XS 2.1

Laguna XS 2.1 — это специализированная модель-агент для программирования в категории 33B-A3B, предлагающая значительное улучшение производительности по сравнению с предыдущими версиями. Благодаря контекстному окну в 262 144 токена, она эффективно справляется с анализом крупных кодовых баз и сложными задачами разработки.

Вход: 8 ₽/MВыход: 15 ₽/M

ПрограммированиеТехнологии+1

Читать →

Anthropic30 июня 2026 г.

Anthropic: Claude Sonnet 5

Claude Sonnet 5 — это передовая модель от Anthropic, демонстрирующая флагманскую производительность в программировании и создании автономных агентов. Она поддерживает адаптивное мышление с настраиваемыми уровнями сложности рассуждений и обладает огромным контекстным окном в 1 миллион токенов.

Вход: 230 ₽/MВыход: 1 150 ₽/M

ПрограммированиеТехнологии+2

Читать →

Google30 июня 2026 г.

Google: Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)

Nano Banana 2 Lite — это самая быстрая и оптимизированная модель в линейке Gemini, предназначенная для мгновенной генерации изображений и визуального анализа. Она идеально подходит для разработчиков, которым требуется высокая пропускная способность и минимальные задержки при работе с мультимодальными данными.

Вход: 32 ₽/MВыход: 187 ₽/M

ТехнологииМаркетинг+2

Читать →

Nex-agi24 июня 2026 г.

Nex AGI: Nex-N2-Mini

Nex-N2-Mini — это компактная мультимодальная модель с архитектурой Mixture-of-Experts, оптимизированная для работы в качестве автономного агента. Она поддерживает обработку текста и изображений, предлагая внушительное контекстное окно для решения сложных задач в программировании и анализе данных.

Вход: 4 ₽/MВыход: 13 ₽/M

ПрограммированиеТехнологии+2

Читать →

Sakana24 июня 2026 г.

Sakana: Fugu Ultra

Fugu Ultra — это флагманская мультиагентная система от Sakana AI, использующая инновационный метод маршрутизации запросов между специализированными агентами. Модель поддерживает работу с текстом и изображениями, предлагая внушительное контекстное окно в 1 миллион токенов для решения сложнейших задач.

Вход: 575 ₽/MВыход: 3 450 ₽/M

ТехнологииНаука+2

Читать →

Google18 июня 2026 г.

Google: Nano Banana 2 (Gemini 3.1 Flash Image)

Gemini 3.1 Flash Image, известная как Nano Banana 2, представляет собой передовую модель Google для генерации и редактирования изображений. Она сочетает в себе визуальное качество профессионального уровня с высокой скоростью работы и поддержкой длинного контекста.

Вход: 60 ₽/MВыход: 359 ₽/M

МаркетингТехнологии+2

Читать →

Google18 июня 2026 г.

Google: Nano Banana Pro (Gemini 3 Pro Image)

Nano Banana Pro (Gemini 3 Pro Image) — это передовая мультимодальная модель от Google, предназначенная для генерации и редактирования изображений с глубоким пониманием контекста. Она сочетает в себе мощные возможности рассуждения Gemini 3 Pro с улучшенным заземлением на реальные объекты.

Вход: 230 ₽/MВыход: 1 380 ₽/M

ТехнологииМаркетинг+2

Читать →

Cohere17 июня 2026 г.

Cohere: North Mini Code (Бесплатно)

North Mini Code — это первая агентная модель Cohere, оптимизированная специально для написания кода и решения сложных технических задач. Благодаря архитектуре Mixture-of-Experts с 3 миллиардами активных параметров, она обеспечивает высокую скорость работы при сохранении точности в программировании.

Вход: — ₽/MВыход: — ₽/M

ПрограммированиеТехнологии+1

Читать →

Z-ai16 июня 2026 г.

Z.ai: GLM 5.2

GLM-5.2 — это флагманская модель от Z.ai, специально разработанная для выполнения сложных задач с длительным горизонтом планирования. Благодаря контекстному окну в 1 миллион токенов, она эффективно справляется с анализом масштабных инженерных проектов и надежным следованием инструкциям.

Вход: 44 ₽/MВыход: 137 ₽/M

ПрограммированиеТехнологии+2

Читать →

Moonshotai12 июня 2026 г.

MoonshotAI: Kimi K2.7 Code

MoonshotAI: Kimi K2.7 Code — это специализированная мультимодальная модель, оптимизированная для решения сложных задач программирования и работы с длинным контекстом. Благодаря архитектуре Mixture-of-Experts, она эффективно справляется с написанием кода и анализом визуальных данных.

Вход: 87 ₽/MВыход: 419 ₽/M

ПрограммированиеТехнологии+2

Читать →

Anthropic09 июня 2026 г.

Anthropic: Claude Fable 5

Claude Fable 5 — это модель класса Mythos, специально разработанная для автономной интеллектуальной работы и сложного программирования. Она поддерживает контекст до 1 миллиона токенов и обладает продвинутыми способностями к рассуждению при обработке текста, изображений и файлов.

Вход: 1 104 ₽/MВыход: 5 520 ₽/M

ПрограммированиеТехнологии+3

Читать →

Nex-agi08 июня 2026 г.

Nex AGI: Nex-N2-Pro

Nex-N2-Pro — это продвинутая мультимодальная модель на архитектуре Qwen3.5, использующая метод смеси экспертов (MoE) для эффективной обработки текста и изображений. Благодаря огромному контекстному окну в 262 144 токена и поддержке логических рассуждений, она отлично подходит для работы со сложными агентскими сценариями.

Вход: 32 ₽/MВыход: 125 ₽/M

ТехнологииПрограммирование+2

Читать →

Nvidia04 июня 2026 г.

NVIDIA: Nemotron 3.5 Content Safety (Бесплатно)

NVIDIA Nemotron 3.5 Content Safety — это специализированная мультимодальная модель на 4 миллиарда параметров, предназначенная для фильтрации контента. Она эффективно модерирует как текстовые запросы, так и изображения, обеспечивая безопасность взаимодействия с ИИ-системами.

Вход: — ₽/MВыход: — ₽/M

ТехнологииЮридические задачи+1

Читать →

Nvidia04 июня 2026 г.

NVIDIA: Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra — это передовая модель с архитектурой Mixture-of-Experts (MoE), сочетающая трансформеры и Mamba для эффективного рассуждения. Благодаря контекстному окну в 1 миллион токенов, она отлично справляется со сложной оркестрацией и анализом масштабных данных.

Вход: 60 ₽/MВыход: 264 ₽/M

ТехнологииНаука+2

Читать →

Nvidia04 июня 2026 г.

NVIDIA: Nemotron 3 Ultra (Бесплатно)

NVIDIA Nemotron 3 Ultra — это передовая модель с архитектурой Mixture-of-Experts (MoE), сочетающая трансформеры и Mamba для эффективного рассуждения. Благодаря 55 миллиардам активных параметров и контекстному окну в 1 миллион токенов, она отлично справляется со сложной оркестрацией задач.

Вход: — ₽/MВыход: — ₽/M

ТехнологииНаука+2

Читать →

Qwen03 июня 2026 г.

Qwen: Qwen3.7 Plus

Qwen3.7 Plus представляет собой сбалансированное решение в линейке Alibaba, предлагающее расширенные возможности обработки текста и изображений. Модель выделяется огромным контекстным окном в 1 миллион токенов, что позволяет эффективно работать с лонгридами и сложными визуальными данными.

Вход: 40 ₽/MВыход: 159 ₽/M

ТехнологииПрограммирование+2

Читать →

Minimax31 мая 2026 г.

MiniMax: MiniMax M3

MiniMax M3 — это мощная мультимодальная модель, способная обрабатывать текст, изображения и видео с впечатляющим контекстным окном в 1 миллион токенов. Она оптимизирована для решения сложных задач программирования и длительной работы в режиме автономного агента.

Вход: 38 ₽/MВыход: 150 ₽/M

ПрограммированиеТехнологии+2

Читать →

Stepfun28 мая 2026 г.

StepFun: Step 3.7 Flash

Step 3.7 Flash — это высокоэффективная мультимодальная модель на базе архитектуры Mixture-of-Experts, предназначенная для быстрой обработки текста, изображений и видео. Благодаря контекстному окну в 256 000 токенов и нативному визуальному кодировщику, она обеспечивает глубокое понимание сложного контента при минимальных задержках.

Вход: 25 ₽/MВыход: 143 ₽/M

ТехнологииМаркетинг+2

Читать →

Anthropic27 мая 2026 г.

Anthropic: Claude Opus 4.8 (Fast)

Claude Opus 4.8 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, сочетающая глубокие аналитические способности с увеличенной скоростью генерации. Модель поддерживает работу с текстом, изображениями и файлами в рамках огромного контекстного окна в 1 миллион токенов.

Вход: 1 104 ₽/MВыход: 5 520 ₽/M

ТехнологииПрограммирование+3

Читать →

Anthropic27 мая 2026 г.

Anthropic: Claude Opus 4.8

Claude Opus 4.8 — это самая мощная модель в семействе Opus от Anthropic, предлагающая продвинутые возможности рассуждения и обработки мультимодальных данных. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна анализировать огромные массивы документов, изображений и кода с высокой точностью.

Вход: 575 ₽/MВыход: 2 875 ₽/M

ТехнологииНаука+3

Читать →

Qwen21 мая 2026 г.

Qwen: Qwen3.7 Max

Qwen3.7 Max — это флагманская модель от Alibaba, оптимизированная для сложных агентских сценариев и продуктивной офисной работы. Она обладает внушительным контекстным окном в 1 миллион токенов и демонстрирует исключительные результаты в программировании и логических задачах.

Вход: 150 ₽/MВыход: 449 ₽/M

ПрограммированиеТехнологии+3

Читать →

X-ai20 мая 2026 г.

xAI: Grok Build 0.1

Grok Build 0.1 — это специализированная модель от xAI, оптимизированная для агентной разработки программного обеспечения и интерактивного кодинга. Она поддерживает мультимодальный ввод данных и обладает внушительным контекстным окном в 256 000 токенов для работы со сложными проектами.

Вход: 120 ₽/MВыход: 240 ₽/M

ПрограммированиеТехнологии+1

Читать →

Google20 мая 2026 г.

Google: Gemini Embedding 2

Gemini Embedding 2 — это первая мультимодальная модель эмбеддингов от Google, позволяющая преобразовывать текст и изображения в единое векторное пространство. Она идеально подходит для создания продвинутых систем семантического поиска и реализации RAG-архитектур с поддержкой различных типов контента.

Вход: 25 ₽/MВыход: — ₽/M

ТехнологииНаука+2

Читать →

Google19 мая 2026 г.

Google: Gemini 3.5 Flash

Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, сочетающая скорость работы с продвинутыми навыками программирования и логического вывода. Она оптимизирована для параллельного выполнения агентских задач и обработки огромных объемов данных благодаря контекстному окну в 1 миллион токенов.

Вход: 90 ₽/MВыход: 539 ₽/M

ПрограммированиеТехнологии+2

Читать →

Anthropic12 мая 2026 г.

Anthropic: Claude Opus 4.7 (Fast)

Claude Opus 4.7 (Fast) — это высокопроизводительная версия флагманской модели от Anthropic, сочетающая глубокие аналитические способности с увеличенной скоростью генерации. Модель поддерживает работу с огромным контекстом до 1 миллиона токенов и эффективно обрабатывает текст, изображения и файлы.

Вход: 3 312 ₽/MВыход: 16 560 ₽/M

ПрограммированиеТехнологии+3

Читать →

Perceptron12 мая 2026 г.

Perceptron: Perceptron Mk1

Perceptron Mk1 — это флагманская мультимодальная модель, специализирующаяся на глубоком анализе видеоконтента и визуальном мышлении. Она эффективно объединяет обработку изображений и видео с естественным языком для создания детальных отчетов и логических выводов.

Вход: 19 ₽/MВыход: 187 ₽/M

ТехнологииНаука+1

Читать →

Inclusionai08 мая 2026 г.

inclusionAI: Ring-2.6-1T

Ring-2.6-1T — это масштабная модель с архитектурой мышления, оптимизированная для сложных агентных рабочих процессов и написания кода. Благодаря 63 миллиардам активных параметров и внушительному контекстному окну, она обеспечивает высокую эффективность в решении многоступенчатых задач и интеграции с инструментами.

Вход: 10 ₽/MВыход: 78 ₽/M

ПрограммированиеТехнологии+2

Читать →

Google07 мая 2026 г.

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.

Вход: 16 ₽/MВыход: 94 ₽/M

ТехнологииПрограммирование+2

Читать →

Openai05 мая 2026 г.

OpenAI: GPT Chat Latest

GPT Chat Latest — это актуальная версия флагманской модели от OpenAI, которая автоматически обновляется до самых свежих стабильных релизов. Она поддерживает мультимодальный ввод, включая текст, изображения и файлы, предлагая внушительное контекстное окно в 400 000 токенов.

Вход: 575 ₽/MВыход: 3 450 ₽/M

ТехнологииПрограммирование+3

Читать →

X-ai30 апреля 2026 г.

xAI: Grok 4.3

Grok 4.3 — это продвинутая мультимодальная модель от xAI, специализирующаяся на сложных рассуждениях и работе с контекстом до 1 миллиона токенов. Она отлично справляется с агентными сценариями, строгим следованием инструкциям и анализом визуальных данных.

Вход: 150 ₽/MВыход: 299 ₽/M

ТехнологииПрограммирование+3

Читать →

Ibm-granite30 апреля 2026 г.

IBM: Granite 4.1 8B

IBM Granite 4.1 8B — это компактная и эффективная языковая модель, оптимизированная для корпоративных задач и работы с длинными контекстами до 131 тысячи токенов. Она демонстрирует высокую точность в структурировании данных и использовании инструментов, что делает её надежным решением для автоматизации бизнес-процессов.

Вход: 7 ₽/MВыход: 13 ₽/M

ТехнологииФинансы+2

Читать →

Mistralai30 апреля 2026 г.

Mistral: Mistral Medium 3.5

Mistral Medium 3.5 — это мощная плотная модель на 128 миллиардов параметров, оптимизированная для сложных агентских сценариев и программирования. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки объемных документов.

Вход: 180 ₽/MВыход: 897 ₽/M

ПрограммированиеТехнологии+2

Читать →

Nvidia28 апреля 2026 г.

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

NVIDIA Nemotron 3 Nano Omni — это передовая мультимодальная модель, способная обрабатывать текст, изображения, аудио и видео. Она оптимизирована для работы в качестве интеллектуального агента в корпоративных системах, предлагая глубокое логическое рассуждение и внушительное контекстное окно.

Вход: — ₽/MВыход: — ₽/M

ТехнологииНаука+2

Читать →

Poolside28 апреля 2026 г.

Poolside: Laguna M.1

Poolside: Laguna M.1 — это флагманская модель, специально оптимизированная для решения сложных задач в области программной инженерии. Она разработана для автономных агентных рабочих процессов, поддерживая вызов инструментов, структурированный вывод и глубокое рассуждение. Благодаря внушительному контекстному окну модель способна эффективно анализировать обширные кодовые базы.

Вход: 25 ₽/MВыход: 50 ₽/M

ПрограммированиеТехнологии+1

Читать →

Poolside28 апреля 2026 г.

Poolside: Laguna M.1 (Бесплатно)

Laguna M.1 — это флагманская модель от Poolside, специально разработанная для решения сложных инженерных задач и написания кода. Она поддерживает агентные рабочие процессы, вызов инструментов и обладает внушительным контекстным окном в 128K токенов.

Вход: — ₽/MВыход: — ₽/M

ПрограммированиеТехнологии+1

Читать →

Qwen27 апреля 2026 г.

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus — это мощная мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря рекордному контекстному окну в 1 миллион токенов, она идеально подходит для анализа сверхдлинных документов и сложных медиафайлов.

Вход: 36 ₽/MВыход: 216 ₽/M

ТехнологииПрограммирование+2

Читать →

Qwen27 апреля 2026 г.

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это высокопроизводительная мультимодальная модель от Alibaba, оптимизированная для мгновенной обработки данных. Она поддерживает работу с текстом, изображениями и видео, предлагая внушительное контекстное окно в 1 миллион токенов для анализа сверхбольших документов.

Вход: 24 ₽/MВыход: 140 ₽/M

ТехнологииПрограммирование+2

Читать →

Qwen27 апреля 2026 г.

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это мультимодальная модель от Alibaba Cloud, использующая гибридную архитектуру Mixture-of-Experts для эффективной обработки текста, изображений и видео. Благодаря 35 миллиардам общих параметров и огромному контекстному окну, она обеспечивает высокую точность анализа сложных визуальных и текстовых данных.

Вход: 18 ₽/MВыход: 125 ₽/M

ТехнологииНаука+2

Читать →

Qwen27 апреля 2026 г.

Qwen: Qwen3.6 Max Preview

Qwen3.6 Max Preview — это флагманская модель от Alibaba Cloud, построенная на архитектуре MoE с 1 триллионом параметров. Она демонстрирует выдающиеся способности в агентном программировании, использовании инструментов и обработке сверхдлинных контекстов до 262 тысяч токенов.

Вход: 125 ₽/MВыход: 747 ₽/M

ПрограммированиеТехнологии+2

Читать →

Qwen27 апреля 2026 г.

Qwen: Qwen3.6 27B

Qwen3.6 27B — это продвинутая мультимодальная модель от Alibaba, способная обрабатывать текст, изображения и видео. Благодаря внушительному контекстному окну в 262 тысячи токенов, она эффективно справляется с анализом длинных документов и сложных медиафайлов.

Вход: 35 ₽/MВыход: 240 ₽/M

ТехнологииПрограммирование+2

Читать →

Openai24 апреля 2026 г.

OpenAI: GPT-5.5 Pro

GPT-5.5 Pro — это флагманская модель от OpenAI, разработанная для глубокого логического анализа и решения критически важных задач. Благодаря рекордному контекстному окну более 1 миллиона токенов, она способна обрабатывать огромные массивы данных с высокой точностью.

Вход: 1 656 ₽/MВыход: 9 936 ₽/M

ТехнологииНаука+3

Читать →

Openai24 апреля 2026 г.

OpenAI: GPT-5.5

GPT-5.5 представляет собой передовую модель от OpenAI, оптимизированную для решения сложнейших профессиональных задач с повышенной надежностью. Благодаря контекстному окну более 1 миллиона токенов и улучшенным механизмам рассуждения, она эффективно справляется с анализом огромных массивов данных и мультимодальным контентом.

Вход: 288 ₽/MВыход: 1 725 ₽/M

ТехнологииНаука+3

Читать →

Deepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Pro

DeepSeek V4 Pro — это масштабная модель на архитектуре Mixture-of-Experts с 1,6 трлн параметров, оптимизированная для сложного логического вывода и программирования. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна обрабатывать огромные массивы данных и длинные цепочки рассуждений.

Вход: 55 ₽/MВыход: 109 ₽/M

ПрограммированиеТехнологии+2

Читать →

Deepseek24 апреля 2026 г.

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это высокопроизводительная модель с архитектурой Mixture-of-Experts, оптимизированная для мгновенного отклика. Благодаря поддержке контекстного окна в 1 миллион токенов, она идеально подходит для обработки сверхдлинных документов и сложного анализа данных.

Вход: 10 ₽/MВыход: 20 ₽/M

ПрограммированиеТехнологии+3

Читать →

Inclusionai23 апреля 2026 г.

inclusionAI: Ling-2.6-1T

Ling-2.6-1T — это флагманская модель с триллионом параметров, оптимизированная для работы в качестве быстрого ИИ-агента. Она сочетает в себе огромную вычислительную мощность с высокой скоростью исполнения, что делает её подходящей для масштабных корпоративных задач.

Вход: 10 ₽/MВыход: 78 ₽/M

ТехнологииПрограммирование+2

Читать →

Tencent22 апреля 2026 г.

Tencent: Hy3 preview

Tencent Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в агентских сценариях. Она поддерживает гибкую настройку уровней рассуждения, что позволяет адаптировать её под задачи разной сложности в производственных средах.

Вход: 8 ₽/MВыход: 27 ₽/M

ТехнологииПрограммирование+2

Читать →

Xiaomi22 апреля 2026 г.

Xiaomi: MiMo-V2.5-Pro

MiMo-V2.5-Pro — это флагманская модель от Xiaomi, оптимизированная для решения сложных инженерных задач и длительных рабочих циклов. Она демонстрирует выдающиеся результаты в бенчмарках на программирование и автономное выполнение агентских функций.

Вход: 55 ₽/MВыход: 109 ₽/M

ПрограммированиеТехнологии+2

Читать →

Xiaomi22 апреля 2026 г.

Xiaomi: MiMo-V2.5

MiMo-V2.5 — это нативная мультимодальная модель от Xiaomi, обеспечивающая производительность уровня Pro-агентов. Она значительно превосходит предыдущие итерации в понимании изображений и видео, предлагая высокую эффективность при выполнении сложных задач.

Вход: 14 ₽/MВыход: 35 ₽/M

ТехнологииНаука+2

Читать →

Openai21 апреля 2026 г.

OpenAI: GPT-5.4 Image 2

GPT-5.4 Image 2 — это передовая мультимодальная модель, объединяющая глубокое логическое мышление с возможностью генерации высококачественных изображений. Она поддерживает работу с длинными контекстами до 272 000 токенов, обеспечивая бесшовный переход между анализом данных, кодингом и визуализацией.

Вход: 920 ₽/MВыход: 1 725 ₽/M

ТехнологииПрограммирование+2

Читать →

Inclusionai21 апреля 2026 г.

inclusionAI: Ling-2.6-flash

Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве автономного агента. Благодаря 7.4 млрд активных параметров она обеспечивает мгновенный отклик и высокую точность при выполнении сложных инструкций.

Вход: 2 ₽/MВыход: 4 ₽/M

ТехнологииПрограммирование+1

Читать →

Alltokens21 апреля 2026 г.

Pareto Code Router

Pareto Code Router — это интеллектуальный инструмент на alltokens, который автоматически выбирает оптимальную модель для программирования на основе заданного порога качества. Он избавляет от необходимости вручную переключаться между нейросетями, гарантируя стабильно высокий результат при написании кода.

Вход: — ₽/MВыход: — ₽/M

ПрограммированиеТехнологии+1

Читать →

Moonshotai20 апреля 2026 г.

MoonshotAI: Kimi K2.6

Kimi K2.6 — это мультимодальная модель нового поколения от Moonshot AI, оптимизированная для сложного программирования и создания UI/UX. Она поддерживает контекст до 262 тысяч токенов и эффективно справляется с многоагентной оркестрацией и долгосрочными задачами разработки.

Вход: 79 ₽/MВыход: 383 ₽/M

ПрограммированиеТехнологии+2

Читать →

Google17 апреля 2026 г.

Google: Gemini Embedding 2 Preview

Gemini Embedding 2 Preview — это первая мультимодальная модель эмбеддингов от Google, способная преобразовывать текст, изображения, видео и PDF в единое векторное пространство. Она идеально подходит для создания продвинутых систем семантического поиска и реализации RAG-сценариев с использованием разнородных данных.

Вход: 25 ₽/MВыход: — ₽/M

ТехнологииНаука+1

Читать →

Anthropic16 апреля 2026 г.

Anthropic: Claude Opus 4.7

Claude Opus 4.7 — это флагманская модель нового поколения, специально оптимизированная для работы автономных агентов и выполнения сложных многоэтапных задач. Благодаря расширенному контекстному окну и улучшенным способностям к программированию, она демонстрирует высочайшую точность в анализе данных и мультимодальных запросах.

Вход: 575 ₽/MВыход: 2 875 ₽/M

ПрограммированиеТехнологии+3

Читать →

Z-ai07 апреля 2026 г.

Z.ai: GLM 5.1

GLM-5.1 представляет собой значительный скачок в области генерации кода и решения долгосрочных задач. Модель способна работать автономно над сложными проектами, выходя за рамки простых коротких взаимодействий благодаря расширенному контекстному окну.

Вход: 116 ₽/MВыход: 364 ₽/M

ПрограммированиеТехнологии+2

Читать →

Google03 апреля 2026 г.

Google: Gemma 4 26B A4B (Бесплатно)

Gemma 4 26B A4B — это эффективная MoE-модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для достижения высокой производительности при низких затратах ресурсов. Благодаря активации всего 3.8 млрд параметров на токен, она обеспечивает качество ответов уровня 31B-моделей и поддерживает мультимодальный ввод, включая текст, изображения и видео.

Вход: — ₽/MВыход: — ₽/M

ТехнологииНаука+2

Читать →

Google03 апреля 2026 г.

Google: Gemma 4 26B A4B

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Вход: 8 ₽/MВыход: 38 ₽/M

ТехнологииПрограммирование+2

Читать →

Google02 апреля 2026 г.

Google: Gemma 4 31B (Бесплатно)

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, способная обрабатывать текст, изображения и видео. Она выделяется огромным контекстным окном в 256K токенов и поддержкой настраиваемого режима рассуждений для решения сложных логических задач.

Вход: — ₽/MВыход: — ₽/M

ТехнологииНаука+2

Читать →

Google02 апреля 2026 г.

Google: Gemma 4 31B

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.

Вход: 15 ₽/MВыход: 44 ₽/M

ПрограммированиеТехнологии+2

Читать →

Qwen02 апреля 2026 г.

Qwen: Qwen3.6 Plus

Qwen3.6 Plus — это передовая мультимодальная модель на базе гибридной архитектуры, объединяющей линейное внимание и разреженную структуру MoE. Она поддерживает обработку текста, изображений и видео с впечатляющим контекстным окном в 1 миллион токенов, обеспечивая высокую производительность в сложных задачах.

Вход: 39 ₽/MВыход: 234 ₽/M

ТехнологииПрограммирование+2

Читать →

Z-ai01 апреля 2026 г.

Z.ai: GLM 5V Turbo

GLM-5V-Turbo — это первая нативная мультимодальная модель от Z.ai, разработанная специально для работы в качестве ИИ-агента. Она эффективно обрабатывает текст, изображения и видео, демонстрируя высокие результаты в долгосрочном планировании и написании кода на основе визуальных данных.

Вход: 144 ₽/MВыход: 479 ₽/M

ПрограммированиеТехнологии+1

Читать →

Arcee-ai01 апреля 2026 г.

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.

Вход: 32 ₽/MВыход: 100 ₽/M

ТехнологииПрограммирование+2

Читать →

X-ai31 марта 2026 г.

xAI: Grok 4.20 Multi-Agent

Grok 4.20 Multi-Agent — это продвинутая мультиагентная система от xAI, предназначенная для глубоких исследований и параллельной обработки сложных задач. Модель способна задействовать до 16 агентов одновременно для координации инструментов и синтеза информации в рамках огромного контекстного окна.

Вход: 150 ₽/MВыход: 299 ₽/M

ТехнологииНаука+2

Читать →

X-ai31 марта 2026 г.

xAI: Grok 4.20

Grok 4.20 — это флагманская модель от xAI, выделяющаяся рекордной скоростью работы и минимальным уровнем галлюцинаций. Она поддерживает контекстное окно до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.

Вход: 150 ₽/MВыход: 299 ₽/M

ТехнологииПрограммирование+3

Читать →

Kwaipilot27 марта 2026 г.

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.

Вход: 38 ₽/MВыход: 150 ₽/M

ПрограммированиеТехнологии+1

Читать →

Rekaai20 марта 2026 г.

Reka Edge

Reka Edge — это высокоэффективная мультимодальная модель на 7 миллиардов параметров, специализирующаяся на глубоком анализе изображений и видео. Она демонстрирует отличные результаты в распознавании объектов и работе в качестве автономного агента с использованием инструментов.

Вход: 13 ₽/MВыход: 13 ₽/M

ТехнологииНаука+1

Читать →

Minimax18 марта 2026 г.

MiniMax: MiniMax M2.7

MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.

Вход: 30 ₽/MВыход: 120 ₽/M

ПрограммированиеФинансы+2

Читать →

Openai17 марта 2026 г.

OpenAI: GPT-5.4 Nano

GPT-5.4 Nano — это самая легкая и экономичная модель в семействе GPT-5.4, оптимизированная для задач с критическими требованиями к скорости. Она поддерживает мультимодальный ввод и идеально подходит для классификации данных, извлечения информации и работы в составе распределенных агентских систем.

Вход: 13 ₽/MВыход: 78 ₽/M

ТехнологииМаркетинг и SEO+2

Читать →

Openai17 марта 2026 г.

OpenAI: GPT-5.4 Mini

GPT-5.4 Mini — это высокопроизводительная модель, оптимизированная для быстрой обработки больших объемов данных с поддержкой текста и изображений. Она сочетает в себе продвинутые возможности рассуждения и кодинга с низкой задержкой, что делает её идеальной для масштабируемых производственных решений.

Вход: 45 ₽/MВыход: 270 ₽/M

ПрограммированиеТехнологии+2

Читать →

Mistralai16 марта 2026 г.

Mistral: Mistral Small 4

Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.

Вход: 19 ₽/MВыход: 75 ₽/M

ПрограммированиеТехнологии+2

Читать →

Perplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, оптимизированная для плотного поиска информации в веб-масштабах. Благодаря 4 миллиардам параметров она обеспечивает максимальное качество извлечения данных и поддерживает контекст до 32 000 токенов.

Вход: 4 ₽/MВыход: — ₽/M

ТехнологииМаркетинг и SEO+1

Читать →

Perplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Компактная модель встраивания (embeddings) от Perplexity с 0,6 млрд параметров, оптимизированная для быстрого поиска в веб-масштабах. Она обеспечивает низкую задержку при генерации векторов и поддерживает внушительный контекст до 32 000 токенов.

Вход: 1 ₽/MВыход: — ₽/M

ТехнологииМаркетинг и SEO+1

Читать →

Z-ai15 марта 2026 г.

Z.ai: GLM 5 Turbo

GLM-5 Turbo от Z.ai — это высокопроизводительная модель, оптимизированная для работы в агентных средах и сценариях OpenClaw. Она демонстрирует исключительную стабильность в длительных рабочих процессах, эффективно справляясь с декомпозицией сложных инструкций и использованием инструментов.

Вход: 144 ₽/MВыход: 479 ₽/M

ТехнологииПрограммирование+1

Читать →