Alltokens

NVIDIA: Nemotron 3 Super (Бесплатно)

NVNvidiaОбновлено: 11 марта 2026 г.

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.

Использовать через API

Метрики

Вход

₽/M

Выход

₽/M

Контекст

262k tokens

Параметры

10

Релиз

11 марта 2026 г.

Поддерживаемые параметры

include_reasoningmax_tokensreasoningresponse_formatseedstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Мульти-средовое обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Для чего

NVIDIA Nemotron 3 Super — это гибридная MoE-модель на 120 млрд параметров, использующая архитектуру Mamba-Transformer для высокой эффективности. Благодаря контекстному окну в 1 млн токенов и мульти-токенному предсказанию, она обеспечивает выдающуюся скорость генерации и точность в сложных многошаговых задачах.

Контекст

262k

Цена ₽

— / —

Для чего

Обе модели доступны бесплатно и ориентированы на высокую скорость генерации при работе с длинным контекстом.

Контекст

256k

Цена ₽

— / —

Модель

Для чего

Являются передовыми открытыми моделями, демонстрирующими высокую производительность в бенчмарках на логику и программирование.

Контекст

128k

Цена ₽

— / —

Когда выбирать

  • Необходима обработка сверхдлинных документов или кодовых баз объемом до 1 млн токенов.
  • Требуется высокая скорость генерации текста без потери качества рассуждений благодаря архитектуре MTP.
  • Планируется разработка сложных многоагентных систем с долгосрочной связностью действий.

Когда не выбирать

  • Требуется работа с мультимодальными данными, так как модель поддерживает только текстовый ввод.
  • Необходима работа через специфические проприетарные API, отличные от инфраструктуры alltokens.
  • Задачи не требуют сложного планирования и могут быть решены более легкими моделями с малым контекстом.

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.