В чем уникальность архитектуры Nemotron 3 Super?

Модель использует гибридную архитектуру Mamba-Transformer Mixture-of-Experts (MoE), которая активирует всего 12 млрд параметров из 120 млрд, обеспечивая эффективность уровня малых моделей при интеллекте гигантов.

Каков максимальный объем контекста поддерживает модель на alltokens?

Модель поддерживает контекстное окно до 1 000 000 токенов, что позволяет проводить глубокий анализ целых библиотек документации или длинных переписок.

Для каких задач лучше всего подходит эта модель?

Она оптимизирована для многошагового планирования, рассуждений между несколькими документами и решения сложных инженерных задач, что подтверждается высокими баллами в SWE-Bench и AIME 2025.

NVIDIA: Nemotron 3 Super (Бесплатно)

NVNvidiaОбновлено: 11 марта 2026 г.

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.

Использовать через API

Метрики

Вход

— ₽/M

Выход

— ₽/M

Контекст

1M tokens

Параметры

Релиз

11 марта 2026 г.

Поддерживаемые параметры

include_reasoningmax_tokensreasoningreasoning_effortresponse_formatseedstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Мульти-средовое обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

NVIDIA: Nemotron 3 Super (Бесплатно)Текущая

Для чего

Контекст

Цена ₽

— / —

NVIDIA: Nemotron 3 Super (Бесплатно)Текущая

— / —

Модель

stepfun/step-3.5-flash:free

Для чего

Обе модели доступны бесплатно и ориентированы на высокую скорость генерации при работе с длинным контекстом.

Контекст

—

Цена ₽

— / —

stepfun/step-3.5-flash:free

—

— / —

Модель

alltokens/aurora-alpha

Для чего

Являются передовыми открытыми моделями, демонстрирующими высокую производительность в бенчмарках на логику и программирование.

Контекст

—

Цена ₽

— / —

alltokens/aurora-alpha

—

— / —

Когда выбирать

Необходима обработка сверхдлинных документов или кодовых баз объемом до 1 млн токенов.
Требуется высокая скорость генерации текста без потери качества рассуждений благодаря архитектуре MTP.
Планируется разработка сложных многоагентных систем с долгосрочной связностью действий.

Когда не выбирать

Требуется работа с мультимодальными данными, так как модель поддерживает только текстовый ввод.
Необходима работа через специфические проприетарные API, отличные от инфраструктуры alltokens.
Задачи не требуют сложного планирования и могут быть решены более легкими моделями с малым контекстом.