nvidia/llama-nemotron-embed-vl-1b-v2:freeМодель встраивания Llama Nemotron Embed VL 1B V2 оптимизирована для мультимодального поиска в задачах ответов на вопросы. Модель способна преобразовывать в векторные представления документы в виде изображений, текста или их комбинации. Поиск документов осуществляется на основе текстового запроса пользователя. Модель поддерживает обработку изображений, содержащих текст, таблицы, диаграммы и инфографику.
Примечание: при использовании бесплатного доступа все запросы и результаты логируются для улучшения модели и сопутствующих сервисов. Пожалуйста, не загружайте личную, конфиденциальную или иную чувствительную информацию. Данный доступ предназначен только для ознакомительного использования. Не используйте его для производственных или критически важных бизнес-систем.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl -X POST https://api.alltokens.ru/api/v1/embeddings \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"input": "The quick brown fox jumps over the lazy dog",
"model": "nvidia/llama-nemotron-embed-vl-1b-v2:free",
"dimensions": 1536
}'NVIDIA: Llama Nemotron Embed VL 1B V2 (Бесплатно) от провайдера nvidia доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
131 072 токенов
Цена эмбеддингов
— / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
25.02.2026
NVIDIA: Nemotron 3.5 Content Safety (Бесплатно)
nvidia
NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель с 4 миллиардами параметров, разработанная NVIDIA и дообученная на базе Google Gemma-3-4B. Модель предназначена для модерации как входных данных, так и ответов больших языковых моделей (LLM) и моделей визуального языка (VLM).
NVIDIA: Nemotron 3 Ultra
nvidia
NVIDIA Nemotron 3 Ultra — это модель для рассуждений и оркестрации с открытым доступом от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.
NVIDIA: Nemotron 3 Ultra (Бесплатно)
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Мультимодальные модели
Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.
Смотреть подборку
nvidia
NVIDIA Nemotron 3 Ultra — это модель для рассуждений на открытых темах и оркестровки от NVIDIA, содержащая 55 миллиардов активных параметров из общего числа 550 миллиардов (MoE). Модель построена на гибридной архитектуре Transformer-Mamba с использованием смеси экспертов.