Что такое dLLM в контексте Inception: Mercury?

Это диффузионная большая языковая модель, которая использует метод дискретной диффузии вместо традиционного авторегрессионного подхода, что позволяет достичь многократного ускорения генерации.

Поддерживает ли модель работу с внешними инструментами?

Да, Mercury на alltokens поддерживает функции tool_choice, работу с внешними инструментами (tools) и структурированный вывод данных.

Каков объем контекстного окна данной модели?

Модель способна обрабатывать до 128 000 токенов в рамках одного запроса, что подходит для анализа объемных документов.

Inception: Mercury

INInceptionОбновлено: 26 июня 2025 г.

Inception: Mercury — это первая большая языковая модель на базе диффузионного подхода (dLLM), обеспечивающая колоссальный прирост производительности. Благодаря инновационному методу дискретной диффузии, она работает в 5-10 раз быстрее оптимизированных моделей конкурентов при сохранении высокого качества генерации.

Использовать через API

Метрики

Вход

32 ₽/M

Выход

94 ₽/M

Контекст

128k tokens

Параметры

Релиз

26 июня 2025 г.

Поддерживаемые параметры

max_tokensresponse_formatstopstructured_outputstemperaturetool_choicetools

Технический обзор

Mercury — это первая большая языковая модель на базе диффузии (dLLM). Благодаря использованию инновационного метода дискретной диффузии, модель работает в 5–10 раз быстрее даже таких оптимизированных по скорости решений, как GPT-4.1 Nano и Claude 3.5 Haiku, при этом не уступая им в производительности. Скорость Mercury позволяет разработчикам создавать максимально отзывчивые интерфейсы, включая голосовых помощников, поисковые системы и чат-ботов. Подробности доступны на сайте alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Inception: MercuryТекущая

Для чего

Контекст

128k

Цена ₽

32 / 94

Inception: MercuryТекущая

128k

32 / 94

Модель

Inception: Mercury 2

Для чего

Является прямым развитием той же архитектуры от Inception с идентичными параметрами контекста.

Контекст

128k

Цена ₽

32 / 94

Inception: Mercury 2

Является прямым развитием той же архитектуры от Inception с идентичными параметрами контекста.

128k

32 / 94

Модель

DeepSeek: DeepSeek V3.1 Terminus

Для чего

Конкурирует в сегменте высокопроизводительных текстовых моделей с сопоставимым объемом контекстного окна.

Контекст

164k

Цена ₽

34 / 118

DeepSeek: DeepSeek V3.1 Terminus

Конкурирует в сегменте высокопроизводительных текстовых моделей с сопоставимым объемом контекстного окна.

164k

34 / 118

Когда выбирать

Если критически важна максимальная скорость генерации текста без потери качества
Для задач, требующих обработки длинных контекстов до 128 000 токенов
При необходимости использования современных инструментов разработки через structured outputs и tools

Когда не выбирать

Если требуется работа с мультимодальным контентом, так как модель ограничена текстом
Для специфических задач, где проверенные авторегрессионные модели показывают большую стабильность
В проектах, где не требуется экстремально высокая скорость отклика системы