nvidia/nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B A3B — это компактная языковая модель с архитектурой Mixture of Experts (MoE), обеспечивающая высочайшую вычислительную эффективность и точность. Она предназначена для разработки специализированных агентных систем искусственного интеллекта.
Модель является полностью открытой: доступны веса, наборы данных и методики обучения. Это позволяет разработчикам легко настраивать, оптимизировать и развертывать решение на собственной инфраструктуре для обеспечения максимальной конфиденциальности и безопасности.
Примечание: при использовании бесплатного доступа все запросы и ответы сохраняются для улучшения модели и сопутствующих сервисов. Пожалуйста, не передавайте личную, конфиденциальную или иную чувствительную информацию. Данный доступ предназначен только для ознакомления и не должен использоваться в рабочих или критически важных бизнес-системах. На платформе alltokens вы можете протестировать возможности этой модели.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/nemotron-3-nano-30b-a3b",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'NVIDIA: Nemotron 3 Nano 30B A3B от провайдера nvidia доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
262 144 токенов
Цена входа
7 ₽ / 1M токенов
Цена выхода
27 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
NVIDIA: Nemotron 3 Super
nvidia
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Многосредовое обучение с подкреплением (RL) на 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.
NVIDIA: Nemotron 3 Super (Бесплатно)
nvidia
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Мульти-средовое обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.
NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)
nvidia
Модель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для мультимодального поиска в задачах ответов на вопросы. Модель способна преобразовывать в векторные представления документы в виде изображений, текста или их комбинации. Поиск документов осуществляется на основе текстового запроса пользователя. Модель поддерживает обработку изображений, содержащих текст, таблицы, диаграммы и инфографику. Примечание: при использовании бесплатного доступа все запросы и результаты логируются для улучшения модели и сопутствующих сервисов. Пожалуйста, не загружайте личную, конфиденциальную или иную чувствительную информацию. Данный доступ предназначен только для ознакомительного использования. Не используйте его для производственных или критически важных бизнес-систем.
NVIDIA: Nemotron 3 Nano 30B A3B (Бесплатно)
nvidia
NVIDIA Nemotron 3 Nano 30B A3B — это компактная языковая модель с архитектурой Mixture of Experts (MoE), обладающая высочайшей вычислительной эффективностью и точностью. Она предназначена для разработки специализированных агентных систем искусственного интеллекта. Модель является полностью открытой: доступны веса, наборы данных и методики обучения. Это позволяет разработчикам легко настраивать, оптимизировать и развертывать решение на собственной инфраструктуре для обеспечения максимальной конфиденциальности и безопасности. Примечание: при использовании бесплатного доступа все запросы и ответы сохраняются для улучшения модели и сопутствующих сервисов. Пожалуйста, не передавайте персональную, конфиденциальную или иную конфиденциальную информацию. Данный доступ предназначен только для ознакомления. Не используйте его для производственных или критически важных бизнес-систем. На платформе alltokens вы можете протестировать возможности данной модели.
NVIDIA: Nemotron Nano 12B 2 VL
nvidia
NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель с 12 миллиардами параметров, предназначенная для анализа видео и интеллектуальной обработки документов. В ней реализована гибридная архитектура Transformer-Mamba, которая сочетает точность трансформеров с эффективным моделированием последовательностей Mamba, что обеспечивает значительно более высокую пропускную способность и низкую задержку. Модель поддерживает ввод текста и многостраничных документов с изображениями, генерируя ответы на естественном языке. Она обучена на высококачественных синтетических наборах данных, подготовленных NVIDIA и оптимизированных для оптического распознавания символов (OCR), анализа графиков и мультимодального понимания. Nemotron Nano 2 VL демонстрирует ведущие результаты в тесте OCRBench v2 и набирает в среднем около 74 баллов в таких бенчмарках, как MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA и Video-MME, превосходя предыдущие открытые мультимодальные модели. Благодаря технологии эффективной выборки видео (EVS) модель способна обрабатывать длинные видеоролики при снижении затрат на инференс. Открытые веса, данные для обучения и рецепты тонкой настройки выпущены под разрешительной лицензией NVIDIA. Развертывание модели поддерживается через NeMo, NIM и основные среды исполнения для инференса на alltokens.
NVIDIA: Nemotron Nano 12B 2 VL (Бесплатно)
nvidia
NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель с 2 миллиардами параметров, предназначенная для анализа видео и интеллектуальной обработки документов. В ней реализована гибридная архитектура Transformer-Mamba, которая сочетает в себе точность трансформеров с эффективным моделированием последовательностей Mamba. Это обеспечивает значительно более высокую пропускную способность и низкую задержку при работе. Модель поддерживает ввод текста и многостраничных документов с изображениями, генерируя ответы на естественном языке. Она обучена на высококачественных синтетических наборах данных, отобранных NVIDIA и оптимизированных для оптического распознавания символов (OCR), анализа графиков и мультимодального понимания. Nemotron Nano 2 VL демонстрирует ведущие результаты в тесте OCRBench v2 и набирает в среднем около 74 баллов в таких бенчмарках, как MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA и Video-MME, превосходя предыдущие открытые мультимодальные модели. Благодаря технологии эффективной выборки видео (EVS) модель способна обрабатывать длинные видеоролики при снижении затрат на инференс. Открытые веса, данные для обучения и рецепты тонкой настройки распространяются под разрешительной лицензией NVIDIA. Развертывание модели поддерживается через NeMo, NIM и основные среды исполнения для инференса на alltokens.
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку