Perplexity16 марта 2026 г.Perplexity: Embed V1 0.6B
Компактная модель встраивания (embeddings) от Perplexity с 0,6 млрд параметров, оптимизированная для быстрого поиска в веб-масштабах. Она обеспечивает низкую задержку при генерации векторов и поддерживает внушительный контекст до 32 000 токенов.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Perplexity16 марта 2026 г.Perplexity: Embed V1 0.6B
Perplexity: Embed V1 0.6B — это компактная и быстрая модель для создания текстовых эмбеддингов, оптимизированная для плотного поиска в веб-масштабах. При объеме в 0.6 млрд параметров она обеспечивает минимальную задержку при генерации векторов, поддерживая контекст до 32 000 токенов.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Intfloat18 ноября 2025 г.
Intfloat: E5-Base-v2
E5-Base-v2 — это эффективная модель эмбеддингов, предназначенная для преобразования английских текстов в плотные векторы размерностью 768. Она оптимизирована для задач семантического поиска и оценки сходства текстов, обеспечивая высокую точность при умеренных вычислительных затратах.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Sentence-transformers18 ноября 2025 г.
Sentence Transformers: paraphrase-MiniLM-L6-v2
Компактная и быстрая модель эмбеддингов, оптимизированная для поиска парафраз и семантического сходства. Она преобразует текст в векторы размерностью 384, обеспечивая высокую точность при минимальных вычислительных затратах.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Sentence-transformers18 ноября 2025 г.
Sentence Transformers: all-MiniLM-L12-v2
Компактная и быстрая модель для создания векторных представлений текста, оптимизированная для семантического поиска и кластеризации. Она преобразует предложения в 384-мерные векторы, обеспечивая отличный баланс между производительностью и качеством обработки коротких фрагментов текста.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Baai18 ноября 2025 г.
BAAI: bge-base-en-v1.5
Компактная и эффективная модель эмбеддингов для английского языка, преобразующая текст в 768-мерные векторы. Версия 1.5 оптимизирована для задач семантического поиска, сопоставления документов и построения систем RAG.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
Sentence-transformers17 ноября 2025 г.
Sentence Transformers: all-mpnet-base-v2
Модель all-mpnet-base-v2 преобразует текст в плотные 768-мерные векторы, обеспечивая высокую точность семантического поиска и кластеризации. Она оптимизирована для работы с предложениями и короткими абзацами, демонстрируя отличные результаты в задачах сопоставления сходства.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Sentence-transformers17 ноября 2025 г.
Sentence Transformers: all-MiniLM-L6-v2
Компактная и эффективная модель эмбеддингов, преобразующая текст в 384-мерные векторы для семантического поиска и кластеризации. Она оптимизирована для быстрой обработки коротких предложений и абзацев с сохранением высокого качества представлений.
Вход: 1 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Thenlper18 ноября 2025 г.
Thenlper: GTE-Large
GTE-Large — это специализированная модель эмбеддингов, предназначенная для преобразования английского текста в плотные векторы размерностью 1024. Она оптимизирована для задач семантического поиска, ранжирования и анализа сходства текстов средней длины.
Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
Intfloat18 ноября 2025 г.
Intfloat: Multilingual-E5-Large
Multilingual-E5-Large — это мощная модель эмбеддингов, предназначенная для преобразования текста в 1024-мерные векторы на более чем 90 языках. Она оптимизирована для задач семантического поиска и кросс-языкового анализа, обеспечивая высокую точность сопоставления документов.
Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииПеревод+2
Читать →
Baai18 ноября 2025 г.
BAAI: bge-large-en-v1.5
BAAI: bge-large-en-v1.5 — это высокоэффективная модель эмбеддингов, преобразующая английский текст в плотные 1024-мерные векторы. Она оптимизирована для задач семантического поиска и извлечения документов, обеспечивая высокую точность сопоставления смыслов.
Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+1
Читать →
Qwen28 октября 2025 г.Qwen: Qwen3 Embedding 8B
Qwen3 Embedding 8B — это современная проприетарная модель для создания текстовых эмбеддингов и ранжирования. Она отличается выдающейся мультиязычностью и поддержкой длинных контекстов до 32 000 токенов.
Вход: 2 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Openai30 октября 2025 г.OpenAI: Text Embedding 3 Small
Высокопроизводительная модель эмбеддингов от OpenAI, пришедшая на смену популярной архитектуре Ada. Она преобразует текст в числовые векторы с контекстным окном до 8192 токенов, обеспечивая точное измерение семантической близости фрагментов данных.
Вход: 3 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Qwen28 октября 2025 г.Qwen: Qwen3 Embedding 4B
Qwen3 Embedding 4B — это современная проприетарная модель для создания векторных представлений текста с поддержкой длинного контекста до 32 768 токенов. Она демонстрирует выдающиеся результаты в мультиязычных задачах и операциях ранжирования, опираясь на архитектурные достижения семейства Qwen.
Вход: 3 ₽/MВыход: 0 ₽/M
ТехнологииАкадемические задачи+2
Читать →
Perplexity16 марта 2026 г.Perplexity: Embed V1 4B
Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, оптимизированная для плотного поиска информации в веб-масштабах. Благодаря 4 миллиардам параметров она обеспечивает максимальное качество извлечения данных и поддерживает контекст до 32 000 токенов.
Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Perplexity16 марта 2026 г.Perplexity: Embed V1 4B
Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, специально оптимизированная для плотного поиска информации в веб-масштабах. Обладая 4 миллиардами параметров, она обеспечивает максимальное качество извлечения данных и поддерживает внушительное контекстное окно в 32 000 токенов.
Вход: 4 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Google30 марта 2026 г.Google: Lyria 3 Clip Preview
Lyria 3 Clip Preview — это специализированная модель Google для генерации высококачественного стерео-аудио с частотой 48 кГц. Она позволяет создавать короткие музыкальные клипы, лупы и превью на основе текстовых промптов или изображений, обеспечивая структурную связность вокала и инструментов.
Цена: 5 ₽ за клип
ТехнологииМаркетинг+1
Читать →
Inclusionai21 апреля 2026 г.
inclusionAI: Ling-2.6-flash
Ling-2.6-flash — это высокопроизводительная модель с архитектурой MoE, оптимизированная для работы в качестве автономного агента. Благодаря 7.4 млрд активных параметров она обеспечивает мгновенный отклик и высокую точность при выполнении сложных инструкций.
Вход: 2 ₽/MВыход: 4 ₽/M
ТехнологииПрограммирование+1
Читать →
Google30 марта 2026 г.Google: Lyria 3 Pro Preview
Lyria 3 Pro Preview — это передовая модель Google для генерации полноценных музыкальных композиций в качестве 48 кГц. Она способна создавать структурированные треки с вокалом и инструменталом на основе текстовых описаний или изображений.
Цена: 10 ₽ за композицию
ТехнологииМаркетинг+1
Читать →
Mistralai31 октября 2025 г.Mistral: Mistral Embed 2312
Mistral Embed — это специализированная модель для создания текстовых эмбеддингов с размерностью 1024, оптимизированная для задач семантического поиска. Она эффективно обрабатывает контекст до 8192 токенов, обеспечивая высокую точность в RAG-системах.
Вход: 13 ₽/MВыход: 0 ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Openai30 октября 2025 г.OpenAI: Text Embedding 3 Large
Text Embedding 3 Large — это наиболее мощная модель эмбеддингов от OpenAI, предназначенная для преобразования текста в высокоточные числовые векторы. Она демонстрирует исключительную эффективность в задачах поиска и анализа семантической близости как для английского, так и для множества других языков.
Вход: 17 ₽/MВыход: 0 ₽/M
ТехнологииНаука+2
Читать →
Ibm-granite20 октября 2025 г.
IBM: Granite 4.0 Micro
IBM Granite 4.0 Micro — это компактная модель с 3 миллиардами параметров, оптимизированная для работы с длинными контекстами до 131 000 токенов. Она представляет собой эффективное решение для быстрой обработки текстовых данных, сочетая высокую скорость работы с актуальными методами дообучения от IBM.
Вход: 3 ₽/MВыход: 14 ₽/M
ТехнологииНаука+2
Читать →
Liquid25 февраля 2026 г.
LiquidAI: LFM2-24B-A2B
LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.
Вход: 4 ₽/MВыход: 15 ₽/M
ТехнологииНаука+2
Читать →
Google31 октября 2025 г.Google: Gemini Embedding 001
Gemini Embedding 001 — это передовая модель для создания векторных представлений текста, демонстрирующая высокие результаты в бенчмарке MTEB. Она обеспечивает глубокое понимание контекста в таких сложных областях, как юриспруденция, финансы и программирование.
Вход: 19 ₽/MВыход: 0 ₽/M
ТехнологииНаука+3
Читать →
Ibm-granite30 апреля 2026 г.
IBM: Granite 4.1 8B
IBM Granite 4.1 8B — это компактная и эффективная языковая модель, оптимизированная для корпоративных задач и работы с длинными контекстами до 131 тысячи токенов. Она демонстрирует высокую точность в структурировании данных и использовании инструментов, что делает её надежным решением для автоматизации бизнес-процессов.
Вход: 7 ₽/MВыход: 13 ₽/M
ТехнологииФинансы+2
Читать →
Openai05 августа 2025 г.OpenAI: gpt-oss-20b
OpenAI: gpt-oss-20b — это открытая модель с архитектурой Mixture-of-Experts (MoE), предлагающая высокую эффективность при 21 миллиарде параметров. Благодаря 3,6 миллиардам активных параметров и внушительному контекстному окну в 128k токенов, она обеспечивает быстрые и точные ответы для широкого спектра задач.
Вход: 4 ₽/MВыход: 18 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen21 июля 2025 г.Qwen: Qwen3 235B A22B Instruct 2507
Qwen3-235B-A22B — это мощная мультиязычная модель с архитектурой Mixture-of-Experts, оптимизированная для точного следования сложным инструкциям. Благодаря огромному контекстному окну в 262 144 токена, она эффективно справляется с анализом длинных документов и генерацией связного текста.
Вход: 9 ₽/MВыход: 13 ₽/M
ТехнологииПеревод+2
Читать →
Qwen10 марта 2026 г.Qwen: Qwen3.5-9B
Qwen3.5-9B — это эффективная мультимодальная модель, объединяющая возможности обработки текста, изображений и видео в компактной архитектуре. Благодаря раннему слиянию токенов и контекстному окну в 262 144 токена, она демонстрирует высокие результаты в логических рассуждениях и программировании.
Вход: 5 ₽/MВыход: 19 ₽/M
ПрограммированиеТехнологии+2
Читать →
Google17 апреля 2026 г.Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель эмбеддингов от Google, способная преобразовывать текст, изображения, видео и PDF в единое векторное пространство. Она идеально подходит для создания продвинутых систем семантического поиска и реализации RAG-сценариев с использованием разнородных данных.
Вход: 25 ₽/MВыход: 0 ₽/M
ТехнологииНаука+1
Читать →
Arcee-ai01 декабря 2025 г.
Arcee AI: Trinity Mini
Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.
Вход: 6 ₽/MВыход: 19 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia05 сентября 2025 г.
NVIDIA: Nemotron Nano 9B V2
NVIDIA Nemotron Nano 9B V2 — это компактная и эффективная модель, обученная с нуля для решения широкого спектра задач. Она объединяет в себе возможности логического рассуждения и стандартной генерации текста, предлагая внушительное контекстное окно в 131 072 токена.
Вход: 5 ₽/MВыход: 20 ₽/M
ТехнологииНаука+2
Читать →
Rekaai20 марта 2026 г.
Reka Edge
Reka Edge — это высокоэффективная мультимодальная модель на 7 миллиардов параметров, специализирующаяся на глубоком анализе изображений и видео. Она демонстрирует отличные результаты в распознавании объектов и работе в качестве автономного агента с использованием инструментов.
Вход: 13 ₽/MВыход: 13 ₽/M
ТехнологииНаука+1
Читать →
Z-ai24 июля 2025 г.
Z.ai: GLM 4 32B
GLM 4 32B — это сбалансированная языковая модель, оптимизированная для решения сложных интеллектуальных задач при высокой скорости работы. Она демонстрирует отличные результаты в программировании, поиске информации в сети и эффективном использовании внешних инструментов.
Вход: 13 ₽/MВыход: 13 ₽/M
ПрограммированиеТехнологии+2
Читать →
Openai05 августа 2025 г.OpenAI: gpt-oss-120b
gpt-oss-120b — это открытая модель от OpenAI с архитектурой Mixture-of-Experts, оптимизированная для сложных логических задач и работы в качестве ИИ-агента. Благодаря активации всего 5.1 млрд параметров при каждом проходе, она сочетает высокую производительность с глубоким пониманием контекста до 128 тысяч токенов.
Вход: 5 ₽/MВыход: 23 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia14 декабря 2025 г.
NVIDIA: Nemotron 3 Nano 30B A3B
NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 262 144 токенов и высокой вычислительной точности, она идеально подходит для развертывания в частной инфраструктуре.
Вход: 7 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Mistralai20 июня 2025 г.Mistral: Mistral Small 3.2 24B
Обновленная модель Mistral Small 3.2 с 24 миллиардами параметров демонстрирует значительный прогресс в точности следования инструкциям и работе с функциональными вызовами. Благодаря расширенному контекстному окну и мультимодальным возможностям, она эффективно справляется с анализом текста и изображений, минимизируя повторы в ответах.
Вход: 10 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Essentialai07 декабря 2025 г.
EssentialAI: Rnj 1 Instruct
EssentialAI: Rnj 1 Instruct — это компактная модель с 8 миллиардами параметров, обученная с нуля для решения сложных аналитических задач. Она демонстрирует высокую эффективность в программировании, математических вычислениях и научном поиске.
Вход: 19 ₽/MВыход: 19 ₽/M
ПрограммированиеНаука+2
Читать →
Bytedance22 июля 2025 г.
ByteDance: UI-TARS 7B
UI-TARS 7B от ByteDance — это специализированная мультимодальная модель, оптимизированная для управления графическими интерфейсами через зрение. Она эффективно работает с десктопными приложениями, веб-браузерами и мобильными системами благодаря обучению с подкреплением.
Вход: 13 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+1
Читать →
Tencent22 апреля 2026 г.
Tencent: Hy3 preview
Tencent Hy3 Preview — это высокоэффективная модель на архитектуре Mixture-of-Experts, оптимизированная для работы в агентских сценариях. Она поддерживает гибкую настройку уровней рассуждения, что позволяет адаптировать её под задачи разной сложности в производственных средах.
Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-Flash
Qwen3.5-Flash — это быстрая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE. Она обеспечивает мгновенный отклик при работе с текстом, изображениями и видео, поддерживая контекст до 1 миллиона токенов.
Вход: 9 ₽/MВыход: 33 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen31 июля 2025 г.Qwen: Qwen3 Coder 30B A3B Instruct
Qwen3 Coder 30B A3B Instruct — это продвинутая модель на архитектуре Mixture-of-Experts, специально оптимизированная для написания кода и работы с масштабными репозиториями. Благодаря поддержке контекста до 160 000 токенов и продвинутому использованию инструментов, она эффективно справляется с задачами агентного программирования.
Вход: 9 ₽/MВыход: 34 ₽/M
ПрограммированиеТехнологии+2
Читать →
Baidu12 августа 2025 г.
Baidu: ERNIE 4.5 21B A3B
ERNIE 4.5 21B A3B — это продвинутая модель на базе архитектуры Mixture-of-Experts (MoE), оптимизированная для эффективной обработки текста и мультимодального понимания. Благодаря активации всего 3 миллиардов параметров на токен, она обеспечивает высокую скорость генерации при сохранении глубокого контекста до 120 000 токенов.
Вход: 9 ₽/MВыход: 35 ₽/M
ТехнологииПеревод+2
Читать →
Deepseek24 апреля 2026 г.DeepSeek: DeepSeek V4 Flash
DeepSeek V4 Flash — это высокопроизводительная модель с архитектурой Mixture-of-Experts, оптимизированная для мгновенного отклика. Благодаря поддержке контекстного окна в 1 миллион токенов, она идеально подходит для обработки сверхдлинных документов и сложного анализа данных.
Вход: 16 ₽/MВыход: 32 ₽/M
ПрограммированиеТехнологии+3
Читать →
Bytedance-seed23 декабря 2025 г.
ByteDance Seed: Seed 1.6 Flash
Seed 1.6 Flash — это сверхбыстрая мультимодальная модель от ByteDance, поддерживающая глубокое мышление и анализ визуального контента. Благодаря контекстному окну в 256k токенов, она эффективно справляется с обработкой объемных документов и сложных медиафайлов.
Вход: 10 ₽/MВыход: 38 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Openai29 октября 2025 г.OpenAI: gpt-oss-safeguard-20b
Специализированная модель от OpenAI на базе архитектуры MoE, предназначенная для обеспечения безопасности и фильтрации контента. Она обладает низким временем отклика и оптимизирована для задач классификации текстов и модерации в реальном времени.
Вход: 10 ₽/MВыход: 38 ₽/M
ТехнологииНаука+1
Читать →
Google03 апреля 2026 г.Google: Gemma 4 26B A4B
Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.
Вход: 8 ₽/MВыход: 41 ₽/M
ТехнологииПрограммирование+2
Читать →
Mistralai02 декабря 2025 г.Mistral: Ministral 3 14B 2512
Ministral 3 14B — это флагманская модель в линейке Ministral, предлагающая производительность уровня Mistral Small 24B при более компактном размере. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 262 144 токена для обработки сложных данных.
Вход: 25 ₽/MВыход: 25 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen29 июля 2025 г.Qwen: Qwen3 30B A3B Instruct 2507
Qwen3 30B A3B Instruct — это эффективная модель на архитектуре Mixture-of-Experts, использующая всего 3.3 млрд активных параметров для быстрой генерации. Она обладает внушительным контекстным окном в 262 тысячи токенов и оптимизирована для точного следования сложным инструкциям.
Вход: 12 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Stepfun29 января 2026 г.
StepFun: Step 3.5 Flash
Step 3.5 Flash — это высокопроизводительная модель на базе архитектуры Mixture of Experts (MoE), которая сочетает огромный объем знаний с высокой скоростью работы. Благодаря активации всего 11 миллиардов параметров из 196 миллиардов, она обеспечивает мгновенные ответы и поддерживает внушительное контекстное окно в 256 тысяч токенов.
Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Xiaomi14 декабря 2025 г.
Xiaomi: MiMo-V2-Flash
MiMo-V2-Flash — это открытая языковая модель от Xiaomi, построенная на архитектуре Mixture-of-Experts с гибридным вниманием. При общем объеме в 309 млрд параметров она задействует лишь 15 млрд активных весов, обеспечивая высокую скорость генерации при огромном контекстном окне в 262 тысячи токенов.
Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПрограммирование+2
Читать →
Mistralai30 октября 2025 г.Mistral: Voxtral Small 24B 2507
Voxtral Small 24B — это продвинутая мультимодальная модель, объединяющая текстовые возможности Mistral Small 3 с функциями обработки аудио. Она демонстрирует высокую точность в транскрибации, переводе и глубоком понимании аудиоконтента при сохранении отличных показателей в текстовых задачах.
Вход: 13 ₽/MВыход: 38 ₽/M
ТехнологииПеревод+1
Читать →
Mistralai10 июля 2025 г.Mistral: Devstral Small 1.1
Devstral Small 1.1 — это специализированная модель на 24 миллиарда параметров, оптимизированная для задач программной инженерии и создания ИИ-агентов. Разработанная совместно с All Hands AI на базе Mistral Small 3.1, она сочетает компактность с высокой эффективностью в написании и анализе кода.
Вход: 13 ₽/MВыход: 38 ₽/M
ПрограммированиеТехнологии+1
Читать →
Microsoft17 октября 2025 г.
Microsoft: Phi 4 Mini Instruct
Phi-4-mini-instruct — это компактная и эффективная модель от Microsoft, обученная на высококачественных синтетических данных с упором на логическое мышление. Несмотря на малый размер, она демонстрирует отличные результаты в задачах рассуждения и обработки длинных контекстов до 128 000 токенов.
Вход: 10 ₽/MВыход: 44 ₽/M
ТехнологииПрограммирование+2
Читать →
Openai07 августа 2025 г.OpenAI: GPT-5 Nano
GPT-5 Nano — это самая компактная и быстрая модель в линейке GPT-5, спроектированная для мгновенного отклика и работы в средах с минимальной задержкой. Она поддерживает мультимодальный ввод и обладает внушительным контекстным окном в 400 000 токенов, что делает её идеальной для оперативной обработки больших объемов данных.
Вход: 7 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai19 января 2026 г.
Z.ai: GLM 4.7 Flash
Z.ai: GLM 4.7 Flash — это высокопроизводительная модель класса 30B, оптимизированная для задач программирования и сложного планирования. Благодаря внушительному контекстному окну более 200 тысяч токенов, она эффективно справляется с анализом объемных документов и разработкой комплексных ИИ-агентов.
Вход: 8 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen28 августа 2025 г.Qwen: Qwen3 30B A3B Thinking 2507
Qwen3 30B A3B Thinking — это специализированная модель на базе архитектуры Mixture-of-Experts, ориентированная на глубокое логическое рассуждение. Она поддерживает расширенные цепочки мыслей, что позволяет эффективно решать сложные многоэтапные задачи в рамках внушительного контекстного окна.
Вход: 10 ₽/MВыход: 50 ₽/M
ТехнологииНаука+2
Читать →
Google02 апреля 2026 г.Google: Gemma 4 31B
Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.
Вход: 15 ₽/MВыход: 46 ₽/M
ПрограммированиеТехнологии+2
Читать →
Bytedance-seed26 февраля 2026 г.
ByteDance Seed: Seed-2.0-Mini
Seed-2.0-Mini — это легковесная мультимодальная модель от ByteDance, оптимизированная для задач с высокой нагрузкой и жесткими требованиями к скорости ответа. Она поддерживает контекст до 256k токенов и предлагает четыре режима сложности рассуждений для гибкого управления ресурсами.
Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Nvidia10 октября 2025 г.
NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
NVIDIA Llama 3.3 Nemotron Super 49B — это оптимизированная версия модели Llama-3.3-70B, сфокусированная на рассуждениях и агентских сценариях. Благодаря контекстному окну в 128K и глубокой постобработке, она отлично справляется с математикой, кодом и сложными RAG-системами.
Вход: 13 ₽/MВыход: 50 ₽/M
ПрограммированиеТехнологии+2
Читать →
Google25 сентября 2025 г.Google: Gemini 2.5 Flash Lite Preview 09-2025
Gemini 2.5 Flash Lite Preview — это сверхлегкая модель, ориентированная на минимальную задержку и высокую пропускную способность при сохранении способностей к рассуждению. Она поддерживает мультимодальный ввод и обладает огромным контекстным окном в 1 миллион токенов.
Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг+2
Читать →
Google22 июля 2025 г.Google: Gemini 2.5 Flash Lite
Gemini 2.5 Flash Lite — это сверхлегкая мультимодальная модель, оптимизированная для мгновенной генерации текста и обработки огромных объемов данных. Она поддерживает контекстное окно до 1 миллиона токенов, позволяя анализировать длинные документы, видео и аудио с минимальными задержками.
Вход: 13 ₽/MВыход: 50 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Qwen23 октября 2025 г.Qwen: Qwen3 VL 32B Instruct
Qwen3-VL-32B-Instruct — это мощная мультимодальная модель с 32 миллиардами параметров, оптимизированная для глубокого анализа изображений и видео. Она поддерживает контекстное окно до 131 072 токенов, обеспечивая высокую точность в задачах визуального восприятия и логического вывода.
Вход: 13 ₽/MВыход: 52 ₽/M
ТехнологииНаука+2
Читать →
Nousresearch26 августа 2025 г.
Nous: Hermes 4 70B
Hermes 4 70B — это гибридная модель от Nous Research, построенная на базе Llama-3.1-70B и поддерживающая продвинутый режим рассуждений. Она сочетает в себе высокую производительность базовой архитектуры с улучшенными способностями к логическому анализу сложных задач.
Вход: 17 ₽/MВыход: 50 ₽/M
ТехнологииНаука+2
Читать →
Nvidia11 марта 2026 г.
NVIDIA: Nemotron 3 Super
NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.
Вход: 12 ₽/MВыход: 56 ₽/M
ПрограммированиеТехнологии+2
Читать →
Alibaba18 сентября 2025 г.
Tongyi DeepResearch 30B A3B
Tongyi DeepResearch 30B A3B — это специализированная агентная модель, оптимизированная для глубокого поиска и анализа информации в рамках длинных контекстных окон. Благодаря архитектуре MoE она активирует всего 3 миллиарда параметров на токен, обеспечивая высокую эффективность при решении сложных исследовательских задач.
Вход: 12 ₽/MВыход: 56 ₽/M
ТехнологииНаука+2
Читать →
Qwen14 октября 2025 г.Qwen: Qwen3 VL 8B Instruct
Qwen3-VL-8B-Instruct — это компактная мультимодальная модель, оптимизированная для глубокого анализа изображений и видео. Благодаря технологии Interleaved-MRoPE она эффективно обрабатывает длинные последовательности данных, обеспечивая высокую точность в задачах визуального рассуждения.
Вход: 10 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
Arcee-ai27 января 2026 г.
Arcee AI: Trinity Large Preview
Arcee AI Trinity Large Preview — это масштабная модель с архитектурой Mixture-of-Experts (MoE), использующая 400 миллиардов параметров при высокой эффективности работы. Она демонстрирует выдающиеся результаты в креативном письме и сложных аналитических задачах благодаря продвинутой системе маршрутизации экспертов.
Вход: 19 ₽/MВыход: 56 ₽/M
ТехнологииНаука+2
Читать →
Deepseek01 декабря 2025 г.DeepSeek: DeepSeek V3.2
DeepSeek V3.2 — это мощная языковая модель, использующая инновационный механизм разреженного внимания DSA для достижения высокой вычислительной эффективности. Она оптимизирована для сложных рассуждений и уверенной работы с инструментами в агентских сценариях.
Вход: 32 ₽/MВыход: 47 ₽/M
ТехнологииПрограммирование+2
Читать →
Nex-agi08 декабря 2025 г.
Nex AGI: DeepSeek V3.1 Nex N1
Флагманская модель серии Nex-N1, прошедшая специализированное дообучение для повышения автономности и эффективности работы с инструментами. Она ориентирована на решение практических задач и демонстрирует высокую производительность в сценариях реального мира.
Вход: 17 ₽/MВыход: 63 ₽/M
ТехнологииПрограммирование+2
Читать →
Allenai21 ноября 2025 г.
AllenAI: Olmo 3 32B Think
Olmo 3 32B Think — это специализированная модель на 32 миллиарда параметров, разработанная для глубоких рассуждений и решения сложных логических задач. Она отлично справляется с многошаговыми инструкциями и демонстрирует высокую точность в аналитических сценариях.
Вход: 19 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
Qwen06 октября 2025 г.Qwen: Qwen3 VL 30B A3B Instruct
Qwen3-VL-30B-A3B-Instruct — это продвинутая мультимодальная модель, объединяющая глубокое понимание визуального контента с мощной текстовой генерацией. Она оптимизирована для выполнения сложных инструкций, анализа изображений и видео, обеспечивая высокую точность восприятия в рамках длинного контекстного окна.
Вход: 17 ₽/MВыход: 65 ₽/M
ТехнологииНаука+2
Читать →
Deepseek29 сентября 2025 г.DeepSeek: DeepSeek V3.2 Exp
DeepSeek V3.2 Exp — это экспериментальная языковая модель, представляющая архитектурный мост к будущим поколениям нейросетей DeepSeek. Она внедряет инновационный механизм разреженного внимания DeepSeek Sparse Attention (DSA) для повышения эффективности обработки данных.
Вход: 34 ₽/MВыход: 51 ₽/M
ТехнологииПрограммирование+2
Читать →
X-ai19 ноября 2025 г.xAI: Grok 4.1 Fast
Grok 4.1 Fast — это высокопроизводительная модель от xAI, оптимизированная для работы в режиме агента и сложного вызова инструментов. Благодаря огромному контекстному окну в 2 миллиона токенов, она отлично справляется с глубокими исследованиями и поддержкой клиентов.
Вход: 25 ₽/MВыход: 63 ₽/M
ТехнологииНаука+2
Читать →
X-ai19 сентября 2025 г.xAI: Grok 4 Fast
Grok 4 Fast — это передовая мультимодальная модель от xAI, сочетающая высокую скорость работы с огромным контекстным окном в 2 миллиона токенов. Модель поддерживает режимы с рассуждениями и без, обеспечивая эффективную обработку текста, изображений и файлов.
Вход: 25 ₽/MВыход: 63 ₽/M
ТехнологииПрограммирование+2
Читать →
Baidu12 августа 2025 г.
Baidu: ERNIE 4.5 VL 28B A3B
Baidu ERNIE 4.5 VL — это передовая мультимодальная модель на архитектуре MoE, которая эффективно сочетает глубокое понимание текста и визуальных данных. Благодаря активации всего 3 миллиардов параметров на токен, она обеспечивает высокую скорость работы при сохранении качества ответов уровня флагманских решений.
Вход: 18 ₽/MВыход: 70 ₽/M
ТехнологииНаука+2
Читать →
Tencent08 июля 2025 г.
Tencent: Hunyuan A13B Instruct
Hunyuan-A13B — это эффективная модель на архитектуре MoE от Tencent с 13 миллиардами активных параметров и поддержкой длинного контекста до 128k токенов. Она специализируется на сложных рассуждениях через цепочки мыслей (Chain-of-Thought) и демонстрирует высокую производительность в логических задачах.
Вход: 18 ₽/MВыход: 71 ₽/M
ТехнологииНаука+2
Читать →
Deepseek01 декабря 2025 г.DeepSeek: DeepSeek V3.2 Speciale
DeepSeek V3.2 Speciale — это высокопроизводительная модель, оптимизированная для сложных рассуждений и работы в качестве автономного агента. Благодаря архитектуре Sparse Attention и усиленному обучению с подкреплением, она эффективно справляется с длинными контекстами и многоступенчатыми задачами.
Вход: 36 ₽/MВыход: 54 ₽/M
ПрограммированиеТехнологии+2
Читать →
Mistralai16 марта 2026 г.Mistral: Mistral Small 4
Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.
Вход: 19 ₽/MВыход: 75 ₽/M
ПрограммированиеТехнологии+2
Читать →
Upstage27 января 2026 г.
Upstage: Solar Pro 3
Solar Pro 3 — это мощная модель на архитектуре Mixture-of-Experts (MoE) от Upstage, использующая 12 млрд активных параметров из 102 млрд. Она обеспечивает высокую производительность и эффективность, предлагая расширенную поддержку корейского, английского и японского языков.
Вход: 19 ₽/MВыход: 75 ₽/M
ТехнологииПеревод+1
Читать →
Allenai06 января 2026 г.
AllenAI: Olmo 3.1 32B Instruct
Olmo 3.1 32B Instruct — это высокопроизводительная языковая модель с 32 миллиардами параметров, оптимизированная для ведения сложных диалогов и точного следования инструкциям. Благодаря расширенному контекстному окну в 64k токенов, она эффективно справляется с анализом объемных документов и многоэтапными задачами.
Вход: 25 ₽/MВыход: 75 ₽/M
ТехнологииАкадемические задачи+2
Читать →
Nvidia28 октября 2025 г.
NVIDIA: Nemotron Nano 12B 2 VL
Мультимодальная модель от NVIDIA с 12 миллиардами параметров, использующая гибридную архитектуру Transformer-Mamba для эффективного анализа видео и документов. Она обеспечивает высокую точность рассуждений при работе с длинными контекстами до 128k токенов, объединяя сильные стороны двух архитектур.
Вход: 25 ₽/MВыход: 75 ₽/M
ТехнологииНаука+2
Читать →
Qwen11 сентября 2025 г.Qwen: Qwen3 Next 80B A3B Thinking
Qwen3 Next 80B A3B Thinking — это специализированная модель, ориентированная на глубокое логическое рассуждение и решение многошаговых задач. Она автоматически генерирует цепочки размышлений, что делает её идеальной для сложного программирования, математических доказательств и агентских сценариев.
Вход: 13 ₽/MВыход: 97 ₽/M
ПрограммированиеНаука+2
Читать →
Qwen04 февраля 2026 г.Qwen: Qwen3 Coder Next
Qwen3 Coder Next — это специализированная языковая модель с открытыми весами, оптимизированная для задач программирования и локальной разработки. Благодаря архитектуре MoE с 80 миллиардами параметров, из которых активны только 3 миллиарда, она обеспечивает высокую скорость работы при сохранении глубокой экспертизы в кодинге.
Вход: 14 ₽/MВыход: 100 ₽/M
ПрограммированиеТехнологии+1
Читать →
Z-ai25 июля 2025 г.
Z.ai: GLM 4.5 Air
GLM-4.5-Air — это облегченная версия флагманской модели, использующая архитектуру Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.
Вход: 17 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
Meituan09 сентября 2025 г.
Meituan: LongCat Flash Chat
Meituan: LongCat Flash Chat — это масштабная модель на архитектуре Mixture-of-Experts (MoE) с 560 миллиардами параметров, оптимизированная для быстрой обработки данных. Благодаря инновационной структуре с сокращенными соединениями, она обеспечивает высокую производительность при работе с длинными контекстами до 128k токенов.
Вход: 25 ₽/MВыход: 100 ₽/M
ТехнологииПрограммирование+2
Читать →
Inception04 марта 2026 г.
Inception: Mercury 2
Mercury 2 — это инновационная диффузионная модель (dLLM), обеспечивающая рекордную скорость генерации свыше 1000 токенов в секунду. Она сочетает в себе глубокие рассуждения с параллельной обработкой данных, что делает её в 5 раз быстрее конкурентов при низкой стоимости эксплуатации.
Вход: 32 ₽/MВыход: 94 ₽/M
ПрограммированиеТехнологии+2
Читать →
Deepseek21 августа 2025 г.DeepSeek: DeepSeek V3.1
DeepSeek V3.1 — это мощная гибридная модель с 671 миллиардом параметров, поддерживающая режимы обычного ответа и глубокого рассуждения. Она оптимизирована для работы с длинным контекстом и демонстрирует высокую эффективность в сложных интеллектуальных задачах.
Вход: 27 ₽/MВыход: 99 ₽/M
ПрограммированиеТехнологии+2
Читать →
Inception26 июня 2025 г.
Inception: Mercury
Inception: Mercury — это первая большая языковая модель на базе диффузионного подхода (dLLM), обеспечивающая колоссальный прирост производительности. Благодаря инновационному методу дискретной диффузии, она работает в 5-10 раз быстрее оптимизированных моделей конкурентов при сохранении высокого качества генерации.
Вход: 32 ₽/MВыход: 94 ₽/M
ТехнологииПрограммирование+2
Читать →
Arcee-ai01 апреля 2026 г.
Arcee AI: Trinity Large Thinking
Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.
Вход: 28 ₽/MВыход: 106 ₽/M
ТехнологииПрограммирование+2
Читать →
Qwen23 сентября 2025 г.Qwen: Qwen3 VL 235B A22B Instruct
Qwen3 VL 235B A22B Instruct — это мощная мультимодальная модель с открытыми весами, объединяющая продвинутую генерацию текста с глубоким анализом изображений и видео. Благодаря огромному контекстному окну в 262 144 токена, она эффективно справляется с парсингом сложных документов, графиков и длинных видеопоследовательностей.
Вход: 25 ₽/MВыход: 110 ₽/M
ТехнологииНаука+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-35B-A3B
Qwen3.5-35B-A3B — это инновационная мультимодальная модель, использующая гибридную архитектуру с линейным вниманием и механизмом Mixture-of-Experts (MoE). Она обеспечивает высокую эффективность инференса и поддерживает обработку текста, изображений и видео в рамках огромного контекстного окна.
Вход: 18 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.6 35B A3B
Qwen3.6-35B-A3B — это мультимодальная модель от Alibaba Cloud, использующая гибридную архитектуру Mixture-of-Experts для эффективной обработки текста, изображений и видео. Благодаря 35 миллиардам общих параметров и огромному контекстному окну, она обеспечивает высокую точность анализа сложных визуальных и текстовых данных.
Вход: 19 ₽/MВыход: 125 ₽/M
ТехнологииНаука+2
Читать →
Qwen17 сентября 2025 г.Qwen: Qwen3 Coder Flash
Qwen3 Coder Flash — это специализированная модель от Alibaba, оптимизированная для быстрой и автономной разработки программного кода. Благодаря поддержке вызова инструментов и огромному контекстному окну, она эффективно справляется с ролью ИИ-агента для программирования.
Вход: 25 ₽/MВыход: 122 ₽/M
ПрограммированиеТехнологии+1
Читать →
Qwen11 сентября 2025 г.Qwen: Qwen3 Next 80B A3B Instruct
Qwen3 Next 80B A3B Instruct — это высокопроизводительная языковая модель, оптимизированная для быстрой генерации ответов без промежуточных этапов рассуждений. Она отлично справляется с программированием, сложными логическими задачами и многоязычными запросами в рамках огромного контекстного окна.
Вход: 12 ₽/MВыход: 137 ₽/M
ПрограммированиеТехнологии+3
Читать →
Z-ai08 декабря 2025 г.
Z.ai: GLM 4.6V
GLM-4.6V — это мощная мультимодальная модель, специализирующаяся на глубоком анализе визуального контента и работе с длинными контекстами до 128K токенов. Она отлично справляется с распознаванием сложных макетов документов, анализом видео и извлечением данных из смешанных медиа-форматов.
Вход: 38 ₽/MВыход: 112 ₽/M
ТехнологииНаука+2
Читать →
Deepseek22 сентября 2025 г.DeepSeek: DeepSeek V3.1 Terminus
DeepSeek V3.1 Terminus — это обновленная версия модели V3.1, в которой улучшена языковая согласованность и расширены возможности агентов. Модель оптимизирована для решения сложных задач с сохранением высокой производительности и точности ответов.
Вход: 34 ₽/MВыход: 118 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax23 декабря 2025 г.
MiniMax: MiniMax M2.1
MiniMax M2.1 — это компактная и высокопроизводительная модель, специально оптимизированная для написания кода и создания автономных агентов. Несмотря на малый объем активируемых параметров, она демонстрирует выдающиеся результаты в разработке современных приложений и сложных рабочих процессах.
Вход: 37 ₽/MВыход: 118 ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax23 октября 2025 г.
MiniMax: MiniMax M2
MiniMax M2 — это высокоэффективная модель с архитектурой MoE, оптимизированная для написания кода и работы в составе автономных агентов. Благодаря 10 миллиардам активных параметров она обеспечивает высокую скорость генерации при сохранении глубокого логического мышления.
Вход: 32 ₽/MВыход: 125 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax12 февраля 2026 г.
MiniMax: MiniMax M2.5
MiniMax M2.5 — это передовая языковая модель, оптимизированная для офисной продуктивности и сложного программирования. Она демонстрирует выдающиеся результаты в работе с документами Word, Excel и PowerPoint, а также эффективно управляет контекстом при переключении между различными программными средами.
Вход: 19 ₽/MВыход: 143 ₽/M
ПрограммированиеТехнологии+2
Читать →
Prime-intellect27 ноября 2025 г.
Prime Intellect: INTELLECT-3
INTELLECT-3 — это высокопроизводительная модель на 106 миллиардов параметров с архитектурой Mixture-of-Experts, обученная на базе GLM-4.5-Air. Благодаря глубокому обучению с подкреплением (RL), она демонстрирует выдающиеся результаты в математических вычислениях и логических задачах при высокой скорости работы.
Вход: 25 ₽/MВыход: 137 ₽/M
ТехнологииНаука+2
Читать →
Qwen27 апреля 2026 г.Qwen: Qwen3.6 Flash
Qwen3.6 Flash — это высокопроизводительная мультимодальная модель от Alibaba, оптимизированная для мгновенной обработки данных. Она поддерживает работу с текстом, изображениями и видео, предлагая внушительное контекстное окно в 1 миллион токенов для анализа сверхбольших документов.
Вход: 24 ₽/MВыход: 140 ₽/M
ТехнологииПрограммирование+2
Читать →
Deepseek24 апреля 2026 г.DeepSeek: DeepSeek V4 Pro
DeepSeek V4 Pro — это масштабная модель на архитектуре Mixture-of-Experts с 1,6 трлн параметров, оптимизированная для сложного логического вывода и программирования. Благодаря рекордному контекстному окну в 1 миллион токенов, она способна обрабатывать огромные массивы данных и длинные цепочки рассуждений.
Вход: 55 ₽/MВыход: 109 ₽/M
ПрограммированиеТехнологии+2
Читать →
Baidu30 июня 2025 г.
Baidu: ERNIE 4.5 300B A47B
ERNIE 4.5 300B A47B — это флагманская языковая модель от Baidu, построенная на архитектуре Mixture-of-Experts (MoE). Она сочетает огромный объем знаний с эффективной генерацией текста, активируя 47 миллиардов параметров для каждого токена.
Вход: 35 ₽/MВыход: 137 ₽/M
ТехнологииПеревод+2
Читать →
Tngtech08 июля 2025 г.
TNG: DeepSeek R1T2 Chimera
TNG: DeepSeek R1T2 Chimera — это продвинутая модель на 671 миллиард параметров, созданная методом слияния экспертных чекпоинтов DeepSeek. Она сочетает в себе возможности логического рассуждения и генерации текста, предлагая внушительное контекстное окно для работы с объемными данными.
Вход: 38 ₽/MВыход: 137 ₽/M
ТехнологииПрограммирование+2
Читать →
Openai17 марта 2026 г.OpenAI: GPT-5.4 Nano
GPT-5.4 Nano — это самая легкая и экономичная модель в семействе GPT-5.4, оптимизированная для задач с критическими требованиями к скорости. Она поддерживает мультимодальный ввод и идеально подходит для классификации данных, извлечения информации и работы в составе распределенных агентских систем.
Вход: 25 ₽/MВыход: 156 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
Minimax18 марта 2026 г.
MiniMax: MiniMax M2.7
MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.
Вход: 35 ₽/MВыход: 150 ₽/M
ПрограммированиеФинансы+2
Читать →
Qwen14 октября 2025 г.Qwen: Qwen3 VL 8B Thinking
Qwen3-VL-8B-Thinking — это специализированная мультимодальная модель с оптимизированным механизмом рассуждений для глубокого анализа визуального контента. Она эффективно справляется с интерпретацией сложных документов, видеопоследовательностей и детализированных сцен благодаря расширенному контекстному окну.
Вход: 15 ₽/MВыход: 170 ₽/M
ТехнологииНаука+2
Читать →
Kwaipilot27 марта 2026 г.
Kwaipilot: KAT-Coder-Pro V2
KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.
Вход: 38 ₽/MВыход: 150 ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax23 января 2026 г.
MiniMax: MiniMax M2-her
MiniMax M2-her — это специализированная языковая модель, оптимизированная для глубокого ролевого взаимодействия и создания выразительных диалогов. Она отлично удерживает контекст персонажа и демонстрирует высокую последовательность в многоходовых беседах.
Вход: 38 ₽/MВыход: 150 ₽/M
Ролевые сценарииПеревод+1
Читать →
Qwen25 июля 2025 г.Qwen: Qwen3 235B A22B Thinking 2507
Qwen3 235B A22B Thinking — это мощная MoE-модель с открытыми весами, специально оптимизированная для глубоких рассуждений и решения сложных логических задач. Благодаря архитектуре Mixture-of-Experts она эффективно задействует 22 млрд параметров для каждого запроса, обеспечивая высокую точность при работе с длинными контекстами до 128k токенов.
Вход: 19 ₽/MВыход: 186 ₽/M
ПрограммированиеТехнологии+3
Читать →
Perceptron12 мая 2026 г.
Perceptron: Perceptron Mk1
Perceptron Mk1 — это флагманская мультимодальная модель, специализирующаяся на глубоком анализе видеоконтента и визуальном мышлении. Она эффективно объединяет обработку изображений и видео с естественным языком для создания детальных отчетов и логических выводов.
Вход: 19 ₽/MВыход: 187 ₽/M
ТехнологииНаука+1
Читать →
Baidu30 июня 2025 г.
Baidu: ERNIE 4.5 VL 424B A47B
ERNIE 4.5 VL — это мощная мультимодальная модель от Baidu, построенная на архитектуре Mixture-of-Experts (MoE) с 424 миллиардами параметров. Она специально оптимизирована для совместной обработки текста и изображений, обеспечивая высокую точность в сложных визуально-текстовых задачах.
Вход: 53 ₽/MВыход: 156 ₽/M
ТехнологииНаука+2
Читать →
Qwen06 октября 2025 г.Qwen: Qwen3 VL 30B A3B Thinking
Qwen3 VL 30B A3B Thinking — это продвинутая мультимодальная модель, объединяющая глубокое визуальное понимание с мощными механизмами логического вывода. Благодаря функции Thinking, нейросеть демонстрирует исключительные результаты в решении сложных STEM-задач и анализе видеоконтента.
Вход: 17 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
X-ai26 августа 2025 г.xAI: Grok Code Fast 1
Grok Code Fast 1 — это специализированная модель от xAI, оптимизированная для быстрой генерации кода и решения сложных инженерных задач. Благодаря поддержке цепочек рассуждений (reasoning traces), разработчики могут контролировать логику модели для достижения максимального качества в агентных сценариях.
Вход: 25 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+1
Читать →
Google07 мая 2026 г.Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.
Вход: 32 ₽/MВыход: 187 ₽/M
ТехнологииПрограммирование+2
Читать →
Google03 марта 2026 г.Google: Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для массовых задач с поддержкой мультимодальных данных. Она превосходит версию 2.5 Flash Lite по качеству и предлагает гибкую настройку уровней «мышления» для баланса между стоимостью и производительностью.
Вход: 32 ₽/MВыход: 187 ₽/M
ПрограммированиеТехнологии+2
Читать →
Qwen25 февраля 2026 г.Qwen: Qwen3.5-27B
Qwen3.5-27B — это производительная мультимодальная модель с линейным механизмом внимания, обеспечивающим высокую скорость отклика. По своим возможностям она сопоставима с более крупной версией 122B, предлагая отличный баланс между эффективностью и качеством обработки визуальных данных.
Вход: 25 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
Qwen16 февраля 2026 г.Qwen: Qwen3.5 Plus 2026-02-15
Qwen3.5 Plus — это передовая мультимодальная модель на гибридной архитектуре, сочетающая линейное внимание и разреженные MoE-слои для высокой эффективности. Она демонстрирует значительный скачок в качестве обработки текста, изображений и видео по сравнению с предыдущим поколением, достигая уровня топовых мировых решений.
Вход: 33 ₽/MВыход: 194 ₽/M
ТехнологииНаука+2
Читать →
Morph07 июля 2025 г.
Morph: Morph V3 Fast
Morph V3 Fast — это специализированная модель для мгновенного применения правок в коде, обеспечивающая скорость обработки до 10 500 токенов в секунду. При точности в 96% она идеально подходит для автоматизации рутинных трансформаций и быстрой итерации программных проектов.
Вход: 96 ₽/MВыход: 144 ₽/M
ПрограммированиеТехнологии+1
Читать →
Qwen23 июля 2025 г.Qwen: Qwen3 Coder 480B A35B
Qwen3 Coder 480B A35B — это мощная MoE-модель, специально оптимизированная для сложных задач программирования и агентного взаимодействия. Благодаря архитектуре смеси экспертов и огромному контекстному окну, она эффективно справляется с вызовом функций и рассуждениями в длинных фрагментах кода.
Вход: 27 ₽/MВыход: 216 ₽/M
ПрограммированиеТехнологии+1
Читать →