В чем особенность архитектуры Nemotron 3 Ultra?

Модель использует гибридную архитектуру Transformer-Mamba в формате Mixture-of-Experts (MoE), где из 550 миллиардов параметров активными являются 55 миллиардов, что оптимизирует производительность.

Какой объем контекста поддерживает модель на alltokens?

Модель поддерживает контекстное окно до 1 000 000 токенов, что позволяет анализировать целые библиотеки документов или огромные массивы кода за один запрос.

Подходит ли модель для разработки ПО?

Да, благодаря продвинутым способностям к рассуждению и поддержке инструментов (tools), она эффективна в программировании и автоматизации сложных технических задач.

NVIDIA: Nemotron 3 Ultra

NVNvidiaОбновлено: 04 июня 2026 г.

NVIDIA Nemotron 3 Ultra — это передовая модель с архитектурой Mixture-of-Experts (MoE), сочетающая трансформеры и Mamba для эффективного рассуждения. Благодаря контекстному окну в 1 миллион токенов, она отлично справляется со сложной оркестрацией и анализом масштабных данных.

Использовать через API

Метрики

Вход

60 ₽/M

Выход

264 ₽/M

Контекст

1M tokens

Параметры

Релиз

04 июня 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biasmax_tokensmin_ppresence_penaltyreasoningreasoning_effortrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Технический обзор

NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

NVIDIA: Nemotron 3 UltraТекущая

Для чего

Контекст

Цена ₽

60 / 264

NVIDIA: Nemotron 3 UltraТекущая

60 / 264

Модель

MoonshotAI: Kimi K2 Thinking

Для чего

Обе модели ориентированы на глубокое логическое рассуждение и работу с длинными контекстами.

Контекст

262k

Цена ₽

72 / 299

MoonshotAI: Kimi K2 Thinking

Обе модели ориентированы на глубокое логическое рассуждение и работу с длинными контекстами.

262k

72 / 299

Модель

Deep Cogito: Cogito v2.1 671B

Для чего

Являются крупными моделями с архитектурой MoE, предназначенными для решения задач frontier-уровня.

Контекст

128k

Цена ₽

150 / 150

Deep Cogito: Cogito v2.1 671B

Являются крупными моделями с архитектурой MoE, предназначенными для решения задач frontier-уровня.

128k

150 / 150

Когда выбирать

Необходима обработка сверхбольших объемов текста до 1 миллиона токенов
Требуется высокая точность в задачах логического вывода и оркестрации процессов
Нужна поддержка структурированного вывода и инструментов для интеграции в сложные системы

Когда не выбирать

Требуется работа с мультимодальным контентом, таким как изображения или видео
Необходима максимально компактная модель для простых и быстрых ответов
Задачи не выходят за рамки коротких диалогов, где не используется потенциал длинного контекста