Модель устарела

Из-за низкой популярности эта модель устарела и была удалена из API 8 мая 2026 г..

NVIDIA: Llama 3.1 Nemotron 70B Instruct

Устарела

nvidia/llama-3.1-nemotron-70b-instruct

131 072 контекст

Вход: 144 ₽/1MВыход: 144 ₽/1M

Вход

Текст

Выход

Текст

Llama 3.1 Nemotron 70B от NVIDIA — это языковая модель, разработанная для генерации точных и полезных ответов. Основанная на архитектуре Llama 3.1 70B и обученная с использованием метода обучения с подкреплением на основе обратной связи от человека (RLHF), она демонстрирует превосходные результаты в тестах на автоматическое выравнивание ответов. Модель адаптирована для приложений, требующих высокой точности и качества генерации, и подходит для обработки разнообразных пользовательских запросов в различных областях.

Использование данной модели регулируется политикой допустимого использования Meta.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstoptemperaturetool_choicetoolstop_ktop_p

Активность

Доступность

Провайдеры для NVIDIA: Llama 3.1 Nemotron 70B Instruct

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

Модель устарела

Эта модель больше недоступна в API, поэтому использовать ее через AllTokens не получится. Быстрый старт для устаревшей модели скрыт, чтобы не вводить в заблуждение.

Технический профиль модели

NVIDIA: Llama 3.1 Nemotron 70B Instruct от провайдера nvidia доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

131 072 токенов

Цена входа

144 ₽ / 1M токенов

Цена выхода

144 ₽ / 1M токенов

Входные модальности

Текст

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Быстрый запуск через OpenAI-совместимый API без отдельной адаптации клиента под провайдера.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Похожие модели

NVIDIA: Nemotron 3 Nano Omni (Бесплатно)

nvidia

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель с 30 миллиардами параметров, разработанная для работы в качестве подсистемы восприятия и контекста в корпоративных агентных системах. Модель принимает текст, изображения, видео и другие виды данных.

API-параметры: 8

Контекст: 256K

NVIDIA: Nemotron 3 Super

nvidia

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Основанная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с много-токеновым предсказанием (MTP), она обеспечивает более чем 50% прирост генерации токенов по сравнению с ведущими открытыми моделями. Модель оснащена контекстным окном в 1 миллион токенов для долгосрочной когерентности агентов, междокументного рассуждения и планирования многошаговых задач. Latent MoE позволяет вызывать 4 эксперта за стоимость одного, улучшая интеллект и обобщение. Многосредовое обучение с подкреплением (RL) на 10+ средах обеспечивает лидирующую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать модель в любом месте — от рабочей станции до облака.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

NVIDIA: Llama 3.1 Nemotron 70B Instruct

Поддерживаемые параметры

Активность

Доступность

Провайдеры для NVIDIA: Llama 3.1 Nemotron 70B Instruct

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости