В чем уникальность архитектуры Nemotron 3 Super?

Модель использует гибридную архитектуру Mamba-Transformer MoE с предсказанием нескольких токенов (MTP), что позволяет активировать всего 12 млрд параметров из 120 млрд, обеспечивая высокую скорость при сохранении точности.

Каков размер контекстного окна этой модели?

Nemotron 3 Super поддерживает контекстное окно до 1 миллиона токенов, что идеально подходит для анализа длинных документов и поддержания связности в длительных сессиях.

Можно ли использовать Nemotron 3 Super через alltokens?

Да, модель доступна через API alltokens, что позволяет интегрировать её передовые возможности в ваши приложения с оплатой за фактически использованные токены.

NVIDIA: Nemotron 3 Super

NVNvidiaОбновлено: 11 марта 2026 г.

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Она оптимизирована для сложных мультиагентных систем и демонстрирует выдающиеся результаты в программировании и логическом планировании.

Использовать через API

Метрики

Вход

12 ₽/M

Выход

56 ₽/M

Контекст

1M tokens

Параметры

Релиз

11 марта 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstoptemperaturetool_choicetoolstop_ktop_logprobstop_p

Технический обзор

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Многосредовое обучение с подкреплением (RL) на 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

NVIDIA: Nemotron 3 SuperТекущая

Для чего

Контекст

Цена ₽

12 / 56

NVIDIA: Nemotron 3 SuperТекущая

12 / 56

Модель

Qwen: Qwen3 Coder 480B A35B

Для чего

Обе модели используют архитектуру Mixture-of-Experts (MoE) и ориентированы на решение сложных технических и логических задач.

Контекст

Цена ₽

27 / 216

Qwen: Qwen3 Coder 480B A35B

27 / 216

Модель

Mistral: Codestral 2508

Для чего

Модели находятся в одной ценовой категории и показывают высокую производительность в задачах разработки и работы с кодом.

Контекст

256k

Цена ₽

38 / 112

Mistral: Codestral 2508

256k

38 / 112

Когда выбирать

Для создания сложных мультиагентных систем и многошагового планирования задач
При необходимости работы с огромными контекстами до 1 млн токенов для анализа документов
Для задач программирования и инженерных вычислений, требующих высокой точности на бенчмарках уровня SWE-Bench

Когда не выбирать

Если требуется максимально низкая стоимость генерации токенов в простых текстовых задачах
Для работы в приложениях, где критически важна поддержка модальностей помимо текста
Если для ваших задач достаточно компактных моделей с меньшим количеством параметров