NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

nvidia/llama-nemotron-embed-vl-1b-v2:free

131 072 контекст

Вход

ТекстИзображения

Выход

Эмбеддинги

Модель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для мультимодального поиска в задачах ответов на вопросы. Модель способна преобразовывать в векторные представления документы в виде изображений, текста или их комбинации. Поиск документов осуществляется на основе текстового запроса пользователя. Модель поддерживает обработку изображений, содержащих текст, таблицы, диаграммы и инфографику.

Примечание: при использовании бесплатного доступа все запросы и результаты логируются для улучшения модели и сопутствующих сервисов. Пожалуйста, не загружайте личную, конфиденциальную или иную чувствительную информацию. Данный доступ предназначен только для ознакомительного использования. Не используйте его для производственных или критически важных бизнес-систем.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

max_tokensseedtemperaturetop_p

Активность

Доступность

Провайдеры для NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl -X POST https://api.alltokens.ru/api/v1/embeddings \
     -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
     -H "Content-Type: application/json" \
     -d '{
  "input": "The quick brown fox jumps over the lazy dog",
  "model": "nvidia/llama-nemotron-embed-vl-1b-v2:free",
  "dimensions": 1536
}'

Технический профиль модели

NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно) от провайдера nvidia доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

131 072 токенов

Цена эмбеддингов

— / 1M токенов

Входные модальности

ТекстИзображения

Выходные модальности

Эмбеддинги

Добавлена в каталог

25.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Мультимодальные кейсы: обработка комбинаций текста и медиа во входящих запросах.
Быстрый запуск через OpenAI-совместимый API без отдельной адаптации клиента под провайдера.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Цена может меняться у провайдера: держите в мониторинге актуальные тарифы перед запуском.
Набор API-параметров ограничен: заранее проверьте поддержку нужных опций генерации.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Похожие модели

NVIDIA: Nemotron 3.5 Content Safety (Бесплатно)

nvidia

NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель с 4 миллиардами параметров, разработанная NVIDIA и дообученная на базе Google Gemma-3-4B. Модель предназначена для модерации как входных данных, так и ответов больших языковых моделей (LLM) и моделей визуального языка (VLM).

API-параметры: 6

Контекст: 128K

NVIDIA: Nemotron 3 Ultra

nvidia

NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

API-параметры: 18

Контекст: 1.0M

NVIDIA: Nemotron 3 Ultra (Бесплатно)

nvidia

NVIDIA Nemotron 3 Ultra — это модель для рассуждений на открытых темах и оркестровки от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.

API-параметры: 9

Контекст: 1.0M

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

nvidia

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель с 30 миллиардами параметров, разработанная для работы в качестве подсистемы восприятия и контекста в корпоративных агентных системах. Модель принимает текст, изображения, видео и другие виды данных.

API-параметры: 8

Контекст: 256K

NVIDIA: Nemotron 3 Super

nvidia

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Многосредовое обучение с подкреплением (RL) на 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

API-параметры: 20

Контекст: 1.0M

NVIDIA: Nemotron 3 Super (Бесплатно)

nvidia

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Мульти-средовое обучение с подкреплением в 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

API-параметры: 11

Контекст: 1.0M

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Мультимодальные модели

Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.

Смотреть подборку

NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

Поддерживаемые параметры

Активность

Доступность

Провайдеры для NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

Поддерживаемые параметры

Активность

Доступность

Провайдеры для NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно)

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости