nvidia/nemotron-nano-12b-v2-vl:freeNVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель с 2 миллиардами параметров, предназначенная для анализа видео и интеллектуальной обработки документов. В ней реализована гибридная архитектура Transformer-Mamba, которая сочетает в себе точность трансформеров с эффективным моделированием последовательностей Mamba. Это обеспечивает значительно более высокую пропускную способность и низкую задержку при работе.
Модель поддерживает ввод текста и многостраничных документов с изображениями, генерируя ответы на естественном языке. Она обучена на высококачественных синтетических наборах данных, отобранных NVIDIA и оптимизированных для оптического распознавания символов (OCR), анализа графиков и мультимодального понимания.
Nemotron Nano 2 VL демонстрирует ведущие результаты в тесте OCRBench v2 и набирает в среднем около 74 баллов в таких бенчмарках, как MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA и Video-MME, превосходя предыдущие открытые мультимодальные модели. Благодаря технологии эффективной выборки видео (EVS) модель способна обрабатывать длинные видеоролики при снижении затрат на инференс.
Открытые веса, данные для обучения и рецепты тонкой настройки распространяются под разрешительной лицензией NVIDIA. Развертывание модели поддерживается через NeMo, NIM и основные среды исполнения для инференса на alltokens.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/nemotron-nano-12b-v2-vl:free",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'NVIDIA: Nemotron Nano 12B 2 VL (Бесплатно) от провайдера nvidia доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
128 000 токенов
Цена входа
— / 1M токенов
Цена выхода
— / 1M токенов
Входные модальности
NVIDIA: Nemotron 3.5 Content Safety (Бесплатно)
nvidia
NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель с 4 миллиардами параметров, разработанная NVIDIA и дообученная на базе Google Gemma-3-4B. Модель предназначена для модерации как входных данных, так и ответов больших языковых моделей (LLM) и моделей визуального языка (VLM).
NVIDIA: Nemotron 3 Ultra
nvidia
NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.
NVIDIA: Nemotron 3 Ultra (Бесплатно)
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Мультимодальные модели
Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.
Смотреть подборку
Выходные модальности
Добавлена в каталог
06.02.2026
nvidia
NVIDIA Nemotron 3 Ultra — это модель для рассуждений на открытых темах и оркестровки от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.