Alltokens

Inception: Mercury

INInceptionОбновлено: 26 июня 2025 г.

Inception: Mercury — это первая большая языковая модель на базе диффузионного подхода (dLLM), обеспечивающая колоссальный прирост производительности. Благодаря инновационному методу дискретной диффузии, она работает в 5-10 раз быстрее оптимизированных моделей конкурентов при сохранении высокого качества генерации.

Использовать через API

Метрики

Вход

32 ₽/M

Выход

94 ₽/M

Контекст

128k tokens

Параметры

7

Релиз

26 июня 2025 г.

Поддерживаемые параметры

max_tokensresponse_formatstopstructured_outputstemperaturetool_choicetools

Технический обзор

Mercury — это первая большая языковая модель на базе диффузии (dLLM). Благодаря использованию инновационного метода дискретной диффузии, модель работает в 5–10 раз быстрее даже таких оптимизированных по скорости решений, как GPT-4.1 Nano и Claude 3.5 Haiku, при этом не уступая им в производительности. Скорость Mercury позволяет разработчикам создавать максимально отзывчивые интерфейсы, включая голосовых помощников, поисковые системы и чат-ботов. Подробности доступны на сайте alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Inception: MercuryТекущая

Для чего

Inception: Mercury — это первая большая языковая модель на базе диффузионного подхода (dLLM), обеспечивающая колоссальный прирост производительности. Благодаря инновационному методу дискретной диффузии, она работает в 5-10 раз быстрее оптимизированных моделей конкурентов при сохранении высокого качества генерации.

Контекст

128k

Цена ₽

32 / 94

Для чего

Является прямым развитием той же архитектуры от Inception с идентичными параметрами контекста.

Контекст

128k

Цена ₽

32 / 94

Для чего

Конкурирует в сегменте высокопроизводительных текстовых моделей с сопоставимым объемом контекстного окна.

Контекст

164k

Цена ₽

34 / 118

Когда выбирать

  • Если критически важна максимальная скорость генерации текста без потери качества
  • Для задач, требующих обработки длинных контекстов до 128 000 токенов
  • При необходимости использования современных инструментов разработки через structured outputs и tools

Когда не выбирать

  • Если требуется работа с мультимодальным контентом, так как модель ограничена текстом
  • Для специфических задач, где проверенные авторегрессионные модели показывают большую стабильность
  • В проектах, где не требуется экстремально высокая скорость отклика системы

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru