Alltokens

Новости

Новые модели, обновления цен и улучшения возможностей.

Подборки моделей

GoogleGoogle03 апреля 2026 г.

Google: Gemma 4 26B A4B

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Вход: 18 ₽/MВыход: 54 ₽/M
ТехнологииПрограммирование+2
Читать →
GoogleGoogle02 апреля 2026 г.

Google: Gemma 4 31B

Gemma 4 31B — это мощная мультимодальная модель от Google DeepMind, поддерживающая работу с текстом и изображениями. Благодаря внушительному контекстному окну в 256K токенов и настраиваемому режиму рассуждений, она отлично справляется со сложным программированием и анализом объемных документов.

Вход: 19 ₽/MВыход: 54 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen02 апреля 2026 г.

Qwen: Qwen3.6 Plus (Бесплатно)

Qwen 3.6 Plus — это мощная мультимодальная модель на базе гибридной архитектуры, демонстрирующая выдающиеся результаты в агентном программировании и сложном логическом выводе. Она значительно превосходит предыдущие итерации в создании фронтенд-приложений и решении задач на уровне целых репозиториев.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai01 апреля 2026 г.

Z.ai: GLM 5V Turbo

GLM-5V-Turbo — это первая нативная мультимодальная модель от Z.ai, разработанная специально для работы в качестве ИИ-агента. Она эффективно обрабатывает текст, изображения и видео, демонстрируя высокие результаты в долгосрочном планировании и написании кода на основе визуальных данных.

Вход: 144 ₽/MВыход: 479 ₽/M
ПрограммированиеТехнологии+1
Читать →
Arcee-ai01 апреля 2026 г.

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open-source модель от Arcee AI, оптимизированная для сложных рассуждений и агентных сценариев. Она демонстрирует высокие результаты в бенчмарке PinchBench и поддерживает внушительное контекстное окно в 262 тысячи токенов.

Вход: 30 ₽/MВыход: 114 ₽/M
ТехнологииПрограммирование+2
Читать →
X-aiX-ai31 марта 2026 г.

xAI: Grok 4.20 Multi-Agent

Grok 4.20 Multi-Agent — это продвинутая мультиагентная система от xAI, предназначенная для глубоких исследований и параллельной обработки сложных задач. Модель способна задействовать до 16 агентов одновременно для координации инструментов и синтеза информации в рамках огромного контекстного окна.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai31 марта 2026 г.

xAI: Grok 4.20

Grok 4.20 — это флагманская модель от xAI, выделяющаяся рекордной скоростью работы и минимальным уровнем галлюцинаций. Она поддерживает контекстное окно до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииПрограммирование+3
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Pro Preview

Lyria 3 Pro Preview — это передовая модель Google для генерации полноценных музыкальных композиций в качестве 48 кГц. Она способна создавать структурированные треки с вокалом и инструменталом на основе текстовых описаний или изображений.

Цена: 11 ₽ за композицию
ТехнологииМаркетинг+1
Читать →
GoogleGoogle30 марта 2026 г.

Google: Lyria 3 Clip Preview

Lyria 3 Clip Preview — это специализированная модель Google для генерации высококачественного стерео-аудио с частотой 48 кГц. Она позволяет создавать короткие музыкальные клипы, лупы и превью на основе текстовых промптов или изображений, обеспечивая структурную связность вокала и инструментов.

Цена: 5 ₽ за клип
ТехнологииМаркетинг+1
Читать →
QwenQwen30 марта 2026 г.

Qwen: Qwen3.6 Plus Preview (Бесплатно)

Qwen 3.6 Plus Preview — это флагманская модель нового поколения с гибридной архитектурой, обеспечивающая высокую эффективность и надежность в агентских задачах. Она значительно превосходит серию 3.5 в логических рассуждениях, фронтенд-разработке и решении сложных комплексных проблем.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+2
Читать →
Kwaipilot27 марта 2026 г.

Kwaipilot: KAT-Coder-Pro V2

KAT-Coder-Pro V2 — это специализированная модель для корпоративной разработки ПО и интеграции SaaS-решений. Она оптимизирована для работы в масштабных продакшн-средах, поддерживает многосистемную координацию и генерацию эстетичных веб-интерфейсов.

Вход: 41 ₽/MВыход: 161 ₽/M
ПрограммированиеТехнологии+1
Читать →
Rekaai20 марта 2026 г.

Reka Edge

Reka Edge — это высокоэффективная мультимодальная модель на 7 миллиардов параметров, специализирующаяся на глубоком анализе изображений и видео. Она демонстрирует отличные результаты в распознавании объектов и работе в качестве автономного агента с использованием инструментов.

Вход: 14 ₽/MВыход: 14 ₽/M
ТехнологииНаука+1
Читать →
Xiaomi18 марта 2026 г.

Xiaomi: MiMo-V2-Omni

MiMo-V2-Omni от Xiaomi — это передовая мультимодальная модель, способная нативно обрабатывать изображения, видео и аудио в единой архитектуре. Благодаря контекстному окну в 256K и продвинутым агентским навыкам, она эффективно справляется с многошаговым планированием и исполнением кода.

Вход: 48 ₽/MВыход: 240 ₽/M
ТехнологииПрограммирование+2
Читать →
Xiaomi18 марта 2026 г.

Xiaomi: MiMo-V2-Pro

MiMo-V2-Pro — это флагманская модель от Xiaomi с объемом параметров более 1 триллиона и внушительным контекстным окном в 1 миллион токенов. Она специально оптимизирована для работы в качестве «мозга» агентных систем, демонстрируя производительность на уровне топовых мировых решений в бенчмарках PinchBench и ClawBench.

Вход: 120 ₽/MВыход: 359 ₽/M
ТехнологииПрограммирование+2
Читать →
Minimax18 марта 2026 г.

MiniMax: MiniMax M2.7

MiniMax M2.7 — это передовая языковая модель, ориентированная на автономную работу и решение сложных производственных задач через мультиагентное взаимодействие. Она демонстрирует высокие результаты в отладке кода, финансовом моделировании и создании полноценных документов в форматах Word, Excel и PowerPoint.

Вход: 41 ₽/MВыход: 161 ₽/M
ПрограммированиеФинансы+2
Читать →
OpenaiOpenai17 марта 2026 г.

OpenAI: GPT-5.4 Nano

GPT-5.4 Nano — это самая легкая и экономичная модель в семействе GPT-5.4, оптимизированная для задач с критическими требованиями к скорости. Она поддерживает мультимодальный ввод и идеально подходит для классификации данных, извлечения информации и работы в составе распределенных агентских систем.

Вход: 27 ₽/MВыход: 167 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
OpenaiOpenai17 марта 2026 г.

OpenAI: GPT-5.4 Mini

GPT-5.4 Mini — это высокопроизводительная модель, оптимизированная для быстрой обработки больших объемов данных с поддержкой текста и изображений. Она сочетает в себе продвинутые возможности рассуждения и кодинга с низкой задержкой, что делает её идеальной для масштабируемых производственных решений.

Вход: 90 ₽/MВыход: 539 ₽/M
ПрограммированиеТехнологии+2
Читать →
MistralaiMistralai16 марта 2026 г.

Mistral: Mistral Small 4

Mistral Small 4 — это универсальная мультимодальная модель, объединяющая возможности анализа текста, обработки изображений и продвинутого написания кода. Благодаря интеграции наработок линеек Pixtral и Devstral, она эффективно справляется со сложными агентными задачами в рамках единого рабочего процесса.

Вход: 21 ₽/MВыход: 81 ₽/M
ПрограммированиеТехнологии+2
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, оптимизированная для плотного поиска информации в веб-масштабах. Благодаря 4 миллиардам параметров она обеспечивает максимальное качество извлечения данных и поддерживает контекст до 32 000 токенов.

Вход: ₽/MВыход: ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 4B

Perplexity: Embed V1 4B — это передовая модель текстовых эмбеддингов, специально оптимизированная для плотного поиска информации в веб-масштабах. Обладая 4 миллиардами параметров, она обеспечивает максимальное качество извлечения данных и поддерживает внушительное контекстное окно в 32 000 токенов.

Вход: ₽/MВыход: ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Компактная модель встраивания (embeddings) от Perplexity с 0,6 млрд параметров, оптимизированная для быстрого поиска в веб-масштабах. Она обеспечивает низкую задержку при генерации векторов и поддерживает внушительный контекст до 32 000 токенов.

Вход: ₽/MВыход: ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
PerplexityPerplexity16 марта 2026 г.

Perplexity: Embed V1 0.6B

Perplexity: Embed V1 0.6B — это компактная и быстрая модель для создания текстовых эмбеддингов, оптимизированная для плотного поиска в веб-масштабах. При объеме в 0.6 млрд параметров она обеспечивает минимальную задержку при генерации векторов, поддерживая контекст до 32 000 токенов.

Вход: ₽/MВыход: ₽/M
ТехнологииМаркетинг и SEO+1
Читать →
Z-ai15 марта 2026 г.

Z.ai: GLM 5 Turbo

GLM-5 Turbo от Z.ai — это высокопроизводительная модель, оптимизированная для работы в агентных средах и сценариях OpenClaw. Она демонстрирует исключительную стабильность в длительных рабочих процессах, эффективно справляясь с декомпозицией сложных инструкций и использованием инструментов.

Вход: 144 ₽/MВыход: 479 ₽/M
ТехнологииПрограммирование+1
Читать →
X-aiX-ai12 марта 2026 г.

xAI: Grok 4.20 Multi-Agent Beta

Grok 4.20 Multi-Agent Beta — это инновационная модель от xAI, использующая систему параллельных агентов для глубоких исследований и координации сложных задач. Благодаря поддержке до 16 агентов в режиме высокого уровня рассуждений, она эффективно синтезирует информацию и работает с контекстом до 2 миллионов токенов.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииНаука+2
Читать →
X-aiX-ai12 марта 2026 г.

xAI: Grok 4.20 Beta

Grok 4.20 Beta — это новый флагман от xAI, выделяющийся рекордной скоростью работы и минимальным уровнем галлюцинаций. Модель поддерживает контекст до 2 миллионов токенов и обладает продвинутыми возможностями вызова инструментов для создания автономных агентов.

Вход: 240 ₽/MВыход: 718 ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens11 марта 2026 г.

Hunter Alpha

Hunter Alpha — это передовая интеллектуальная модель, специально разработанная для создания автономных агентов. Она демонстрирует исключительные результаты в долгосрочном планировании и сложном многошаговом рассуждении, обеспечивая высокую точность следования инструкциям.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens11 марта 2026 г.

Healer Alpha

Healer Alpha — это передовая мультимодальная модель, способная обрабатывать визуальные, аудио и текстовые данные. Она разработана для выполнения сложных многошаговых задач и обладает встроенными способностями к рассуждению и действию в реальном мире.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+1
Читать →
Nvidia11 марта 2026 г.

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.

Вход: 14 ₽/MВыход: 67 ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia11 марта 2026 г.

NVIDIA: Nemotron 3 Super (Бесплатно)

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+2
Читать →
Bytedance-seed10 марта 2026 г.

ByteDance Seed: Seed-2.0-Lite

Seed-2.0-Lite — это сбалансированная модель от ByteDance, оптимизированная для высоконагруженных корпоративных задач с акцентом на экономическую эффективность. Она превосходит предыдущее поколение Seed-1.8, предлагая стабильную работу с длинным контекстом и качественную генерацию структурированных данных.

Вход: 30 ₽/MВыход: 240 ₽/M
ТехнологииМаркетинг+2
Читать →
QwenQwen10 марта 2026 г.

Qwen: Qwen3.5-9B

Qwen3.5-9B — это эффективная мультимодальная модель, объединяющая возможности обработки текста, изображений и видео в компактной архитектуре. Благодаря раннему слиянию токенов и контекстному окну в 262 144 токена, она демонстрирует высокие результаты в логических рассуждениях и программировании.

Вход: 7 ₽/MВыход: 21 ₽/M
ПрограммированиеТехнологии+2
Читать →
OpenaiOpenai05 марта 2026 г.

OpenAI: GPT-5.4 Pro

GPT-5.4 Pro — это флагманская модель от OpenAI с унифицированной архитектурой и продвинутыми способностями к рассуждению. Она обладает внушительным контекстным окном более 1 млн токенов и оптимизирована для решения сложнейших многошаговых задач и агентного программирования.

Вход: 3 312 ₽/MВыход: 19 872 ₽/M
ПрограммированиеТехнологии+3
Читать →
OpenaiOpenai05 марта 2026 г.

OpenAI: GPT-5.4

GPT-5.4 — это передовая мультимодальная модель от OpenAI, объединяющая возможности GPT и Codex с контекстным окном более 1 миллиона токенов. Она оптимизирована для сложного программирования, глубокого анализа документов и выполнения многошаговых рабочих процессов с высокой эффективностью.

Вход: 286 ₽/MВыход: 1 712 ₽/M
ПрограммированиеТехнологии+3
Читать →
Inception04 марта 2026 г.

Inception: Mercury 2

Mercury 2 — это инновационная диффузионная модель (dLLM), обеспечивающая рекордную скорость генерации свыше 1000 токенов в секунду. Она сочетает в себе глубокие рассуждения с параллельной обработкой данных, что делает её в 5 раз быстрее конкурентов при низкой стоимости эксплуатации.

Вход: 34 ₽/MВыход: 101 ₽/M
ПрограммированиеТехнологии+2
Читать →
OpenaiOpenai03 марта 2026 г.

OpenAI: GPT-5.3 Chat

GPT-5.3 Chat — это обновленная версия популярной модели, ориентированная на естественное общение и высокую точность ответов. Она значительно реже выдает необоснованные отказы и лишние предостережения, обеспечивая плавный и контекстуально точный диалог.

Вход: 200 ₽/MВыход: 1 598 ₽/M
ТехнологииМаркетинг+2
Читать →
GoogleGoogle03 марта 2026 г.

Google: Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для массовых задач с поддержкой мультимодальных данных. Она превосходит версию 2.5 Flash Lite по качеству и предлагает гибкую настройку уровней «мышления» для баланса между стоимостью и производительностью.

Вход: 34 ₽/MВыход: 201 ₽/M
ПрограммированиеТехнологии+2
Читать →
Bytedance-seed26 февраля 2026 г.

ByteDance Seed: Seed-2.0-Mini

Seed-2.0-Mini — это легковесная мультимодальная модель от ByteDance, оптимизированная для задач с высокой нагрузкой и жесткими требованиями к скорости ответа. Она поддерживает контекст до 256k токенов и предлагает четыре режима сложности рассуждений для гибкого управления ресурсами.

Вход: 14 ₽/MВыход: 54 ₽/M
ТехнологииМаркетинг и SEO+2
Читать →
GoogleGoogle26 февраля 2026 г.

Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview)

Gemini 3.1 Flash Image Preview (Nano Banana 2) — это передовая модель Google для генерации и редактирования изображений, сочетающая качество уровня Pro с высокой скоростью работы. Она обеспечивает глубокое понимание контекста и позволяет гибко настраивать соотношение сторон через API, оставаясь при этом экономически эффективным решением.

Вход: 60 ₽/MВыход: 359 ₽/M
ТехнологииМаркетинг+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-35B-A3B

Qwen3.5-35B-A3B — это инновационная мультимодальная модель, использующая гибридную архитектуру с линейным вниманием и механизмом Mixture-of-Experts (MoE). Она обеспечивает высокую эффективность инференса и поддерживает обработку текста, изображений и видео в рамках огромного контекстного окна.

Вход: 22 ₽/MВыход: 174 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-27B

Qwen3.5-27B — это производительная мультимодальная модель с линейным механизмом внимания, обеспечивающим высокую скорость отклика. По своим возможностям она сопоставима с более крупной версией 122B, предлагая отличный баланс между эффективностью и качеством обработки визуальных данных.

Вход: 27 ₽/MВыход: 209 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-122B-A10B

Qwen3.5-122B-A10B — это продвинутая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE, обеспечивающая высокую эффективность инференса. Она превосходит предыдущие флагманы Qwen3 по текстовым и визуальным возможностям, занимая второе место в линейке по общей производительности.

Вход: 32 ₽/MВыход: 249 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen25 февраля 2026 г.

Qwen: Qwen3.5-Flash

Qwen3.5-Flash — это быстрая мультимодальная модель на базе гибридной архитектуры с линейным вниманием и MoE. Она обеспечивает мгновенный отклик при работе с текстом, изображениями и видео, поддерживая контекст до 1 миллиона токенов.

Вход: 9 ₽/MВыход: 35 ₽/M
ТехнологииПрограммирование+2
Читать →
Liquid25 февраля 2026 г.

LiquidAI: LFM2-24B-A2B

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Вход: 5 ₽/MВыход: 17 ₽/M
ТехнологииНаука+2
Читать →
GoogleGoogle25 февраля 2026 г.

Google: Gemini 3.1 Pro Preview Custom Tools

Специализированная версия Gemini 3.1 Pro с оптимизированным механизмом вызова функций и инструментов. Модель эффективнее выбирает пользовательские инструменты вместо стандартных bash-команд, сохраняя при этом мультимодальность и контекстное окно в 1 млн токенов.

Вход: 229 ₽/MВыход: 1 369 ₽/M
ПрограммированиеТехнологии+2
Читать →
Nvidia25 февраля 2026 г.

NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

NVIDIA Llama Nemotron Embed VL 1B V2 — это специализированная мультимодальная модель для создания эмбеддингов, оптимизированная для поиска ответов на вопросы. Она способна обрабатывать текст, изображения или их комбинации, эффективно работая с таблицами, графиками и инфографикой.

Вход: ₽/MВыход: ₽/M
ТехнологииНаука+1
Читать →
OpenaiOpenai24 февраля 2026 г.

OpenAI: GPT-5.3-Codex

GPT-5.3-Codex — это передовая агентная модель OpenAI, оптимизированная для сложной разработки ПО и взаимодействия с компьютерными интерфейсами. Она демонстрирует рекордные результаты в тестах SWE-Bench Pro и обладает улучшенными навыками работы с терминалом и кибербезопасностью.

Вход: 200 ₽/MВыход: 1 598 ₽/M
ПрограммированиеТехнологии+3
Читать →
Aion-labs23 февраля 2026 г.

AionLabs: Aion-2.0

Aion-2.0 — это специализированная версия DeepSeek V3.2, созданная для глубокого погружения в ролевые игры и сторителлинг. Модель мастерски создает напряжение и конфликты, обеспечивая высокую вовлеченность в повествование даже при работе со сложными и мрачными темами.

Вход: 96 ₽/MВыход: 192 ₽/M
Ролевые сценарииТехнологии+1
Читать →
GoogleGoogle19 февраля 2026 г.

Google: Gemini 3.1 Pro Preview

Gemini 3.1 Pro Preview — это передовая мультимодальная модель от Google с контекстным окном в 1 миллион токенов, оптимизированная для сложного программирования и автономных агентов. Она демонстрирует значительный прогресс в рассуждениях, финансовом моделировании и автоматизации рабочих процессов с использованием инструментов.

Вход: 229 ₽/MВыход: 1 369 ₽/M
ПрограммированиеФинансы+3
Читать →
AnthropicAnthropic17 февраля 2026 г.

Anthropic: Claude Sonnet 4.6

Claude Sonnet 4.6 — это передовая модель от Anthropic, демонстрирующая флагманскую производительность в программировании и управлении сложными проектами. Она обладает уникальными способностями к автоматизации рабочих процессов через управление компьютером и создание качественного контента.

Вход: 343 ₽/MВыход: 1 712 ₽/M
ПрограммированиеТехнологии+2
Читать →
QwenQwen16 февраля 2026 г.

Qwen: Qwen3.5 Plus 2026-02-15

Qwen3.5 Plus — это передовая мультимодальная модель на гибридной архитектуре, сочетающая линейное внимание и разреженные MoE-слои для высокой эффективности. Она демонстрирует значительный скачок в качестве обработки текста, изображений и видео по сравнению с предыдущим поколением, достигая уровня топовых мировых решений.

Вход: 35 ₽/MВыход: 209 ₽/M
ТехнологииНаука+2
Читать →
QwenQwen16 февраля 2026 г.

Qwen: Qwen3.5 397B A17B

Qwen3.5 397B A17B — это мощная мультимодальная модель на базе гибридной архитектуры MoE и линейного внимания, обеспечивающая высокую эффективность инференса. Она демонстрирует передовые результаты в логическом мышлении, генерации кода и анализе видеоконтента.

Вход: 47 ₽/MВыход: 280 ₽/M
ПрограммированиеТехнологии+2
Читать →
Minimax12 февраля 2026 г.

MiniMax: MiniMax M2.5 (Бесплатно)

MiniMax M2.5 — это передовая языковая модель, оптимизированная для реальных рабочих задач и офисной продуктивности. Она демонстрирует выдающиеся результаты в программировании и автоматизации работы с документами Word, Excel и PowerPoint, эффективно планируя свои действия.

Вход: ₽/MВыход: ₽/M
ПрограммированиеТехнологии+1
Читать →
Minimax12 февраля 2026 г.

MiniMax: MiniMax M2.5

MiniMax M2.5 — это передовая языковая модель, оптимизированная для офисной продуктивности и сложного программирования. Она демонстрирует выдающиеся результаты в работе с документами Word, Excel и PowerPoint, а также эффективно управляет контекстом при переключении между различными программными средами.

Вход: 16 ₽/MВыход: 133 ₽/M
ПрограммированиеТехнологии+2
Читать →
Z-ai11 февраля 2026 г.

Z.ai: GLM 5

GLM-5 от Z.ai — это флагманская open-source модель, специально разработанная для проектирования сложных систем и длительных агентных рабочих процессов. Она ориентирована на экспертную разработку ПО, предлагая возможности автономного планирования и глубокого логического обоснования бэкенд-задач.

Вход: 87 ₽/MВыход: 276 ₽/M
ПрограммированиеТехнологии+2
Читать →
Upstage27 января 2026 г.

Upstage: Solar Pro 3

Solar Pro 3 — это мощная модель на архитектуре Mixture-of-Experts (MoE) от Upstage, использующая 12 млрд активных параметров из 102 млрд. Она обеспечивает высокую производительность и эффективность, предлагая расширенную поддержку корейского, английского и японского языков.

Вход: 21 ₽/MВыход: 81 ₽/M
ТехнологииПеревод+1
Читать →
Nvidia14 декабря 2025 г.

NVIDIA: Nemotron 3 Nano 30B A3B

NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 262 144 токенов и высокой вычислительной точности, она идеально подходит для развертывания в частной инфраструктуре.

Вход: 7 ₽/MВыход: 27 ₽/M
ТехнологииПрограммирование+2
Читать →
Nvidia14 декабря 2025 г.

NVIDIA: Nemotron 3 Nano 30B A3B (Бесплатно)

NVIDIA Nemotron 3 Nano 30B A3B — это компактная и эффективная MoE-модель с открытыми весами, оптимизированная для создания специализированных агентных систем. Благодаря поддержке контекста до 256 000 токенов и высокой вычислительной точности, она идеально подходит для развертывания на собственной инфраструктуре с соблюдением приватности.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+1
Читать →
Rekaai12 марта 2025 г.

Reka Flash 3

Reka Flash 3 — это компактная модель на 21 миллиард параметров, оптимизированная для высокой скорости работы и точного следования инструкциям. Благодаря поддержке явных тегов рассуждения и эффективному квантованию, она обеспечивает производительность уровня проприетарных систем при низких задержках.

Вход: 14 ₽/MВыход: 27 ₽/M
ПрограммированиеТехнологии+1
Читать →
MistralaiMistralai10 сентября 2024 г.

Mistral: Pixtral 12B

Mistral: Pixtral 12B — это первая мультимодальная модель от Mistral AI, способная обрабатывать как текстовые запросы, так и изображения. Она сочетает в себе компактный размер в 12 миллиардов параметров с продвинутыми возможностями визуального анализа.

Вход: 14 ₽/MВыход: 14 ₽/M
ТехнологииПрограммирование+2
Читать →
Alltokens08 ноября 2023 г.

Auto Router

Auto Router — это интеллектуальная мета-модель, которая автоматически перенаправляет ваш запрос к наиболее подходящей нейросети из десятков доступных вариантов. Система анализирует контекст и выбирает оптимальный инструмент, обеспечивая высокое качество ответа при сохранении гибкости настройки.

Вход: ₽/MВыход: ₽/M
ТехнологииПрограммирование+3
Читать →
МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.