Модель устарела

Из-за низкой популярности эта модель устарела и была удалена из API 15 апреля 2026 г..

Inception: Mercury

Устарела

inception/mercury

128 000 контекст

Вход: 32 ₽/1MВыход: 94 ₽/1M

Вход

Текст

Выход

Текст

Mercury — это первая большая языковая модель на базе диффузии (dLLM). Благодаря использованию инновационного метода дискретной диффузии, модель работает в 5–10 раз быстрее даже таких оптимизированных по скорости решений, как GPT-4.1 Nano и Claude 3.5 Haiku, при этом не уступая им в производительности. Скорость Mercury позволяет разработчикам создавать максимально отзывчивые интерфейсы, включая голосовых помощников, поисковые системы и чат-ботов. Подробности доступны на сайте alltokens.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

max_tokensresponse_formatstopstructured_outputstemperaturetool_choicetools

Активность

Доступность

Провайдеры для Inception: Mercury

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

Модель устарела

Эта модель больше недоступна в API, поэтому использовать ее через AllTokens не получится. Быстрый старт для устаревшей модели скрыт, чтобы не вводить в заблуждение.

Технический профиль модели

Inception: Mercury от провайдера inception доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

128 000 токенов

Цена входа

32 ₽ / 1M токенов

Цена выхода

94 ₽ / 1M токенов

Входные модальности

Текст

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Быстрый запуск через OpenAI-совместимый API без отдельной адаптации клиента под провайдера.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Похожие модели

Inception: Mercury 2

inception

Mercury 2 — это невероятно быстрая модель рассуждений и первая модель рассуждений на основе диффузии (dLLM). Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая более 1000 токенов/сек на стандартных GPU. Mercury 2 в 5+ раз быстрее ведущих оптимизированных по скорости моделей, таких как Claude 4.5 Haiku и GPT 5 Mini, при значительно меньшей стоимости. Mercury 2 поддерживает настраиваемые уровни рассуждений, 128K контекста, встроенное использование инструментов и вывод JSON с соответствием схеме. Разработана для рабочих процессов кодирования, где задержка накапливается, для реального голосового поиска и циклов агентов. Совместима с OpenAI API. Подробнее в блоге.

API-параметры: 9

Контекст: 128K

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

Inception: Mercury

Поддерживаемые параметры

Активность

Доступность

Провайдеры для Inception: Mercury

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости