Alltokens

NVIDIA: Nemotron 3 Ultra

NVNvidiaОбновлено: 04 июня 2026 г.

NVIDIA Nemotron 3 Ultra — это передовая модель с архитектурой Mixture-of-Experts (MoE), сочетающая трансформеры и Mamba для эффективного рассуждения. Благодаря контекстному окну в 1 миллион токенов, она отлично справляется со сложной оркестрацией и анализом масштабных данных.

Использовать через API

Метрики

Вход

60 ₽/M

Выход

299 ₽/M

Контекст

1M tokens

Параметры

17

Релиз

04 июня 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biasmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Технический обзор

NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

NVIDIA Nemotron 3 Ultra — это передовая модель с архитектурой Mixture-of-Experts (MoE), сочетающая трансформеры и Mamba для эффективного рассуждения. Благодаря контекстному окну в 1 миллион токенов, она отлично справляется со сложной оркестрацией и анализом масштабных данных.

Контекст

1M

Цена ₽

60 / 299

Для чего

Обе модели ориентированы на глубокое логическое рассуждение и работу с длинными контекстами.

Контекст

262k

Цена ₽

72 / 299

Для чего

Являются крупными моделями с архитектурой MoE, предназначенными для решения задач frontier-уровня.

Контекст

128k

Цена ₽

150 / 150

Когда выбирать

  • Необходима обработка сверхбольших объемов текста до 1 миллиона токенов
  • Требуется высокая точность в задачах логического вывода и оркестрации процессов
  • Нужна поддержка структурированного вывода и инструментов для интеграции в сложные системы

Когда не выбирать

  • Требуется работа с мультимодальным контентом, таким как изображения или видео
  • Необходима максимально компактная модель для простых и быстрых ответов
  • Задачи не выходят за рамки коротких диалогов, где не используется потенциал длинного контекста

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru