DeepSeek: R1 Distill Llama 70B

Рассуждения

deepseek/deepseek-r1-distill-llama-70b

128 000 контекст

Вход: 100 ₽/1MВыход: 100 ₽/1M

Вход

Текст

Выход

Текст

DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, созданная на базе Llama-3.3-70B-Instruct с использованием выходных данных DeepSeek R1. Модель сочетает в себе передовые методы дистилляции для достижения высокой производительности в различных тестах, включая:

AIME 2024 pass@1: 70.0
MATH-500 pass@1: 94.5
Рейтинг CodeForces: 1633

Благодаря тонкой настройке на результатах DeepSeek R1, модель демонстрирует конкурентоспособную эффективность, сопоставимую с крупнейшими флагманскими моделями. На alltokens вы можете получить доступ к возможностям этой модели через API.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyseedstoptemperaturetop_ktop_p

Активность

Доступность

Провайдеры для DeepSeek: R1 Distill Llama 70B

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-r1-distill-llama-70b",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

DeepSeek: R1 Distill Llama 70B от провайдера deepseek доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

128 000 токенов

Цена входа

100 ₽ / 1M токенов

Цена выхода

100 ₽ / 1M токенов

Входные модальности

Текст

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Быстрый запуск через OpenAI-совместимый API без отдельной адаптации клиента под провайдера.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Похожие модели

DeepSeek: DeepSeek V4 Pro

deepseek

DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window. It is designed for advanced reasoning, coding,...

API-параметры: 20

Контекст: 1.0M

DeepSeek: DeepSeek V4 Flash

deepseek

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

API-параметры: 20

Контекст: 1.0M

DeepSeek: DeepSeek V3.2

deepseek

DeepSeek-V3.2 — это большая языковая модель, разработанная для обеспечения высокой вычислительной эффективности в сочетании с мощными способностями к рассуждению и использованием инструментов в качестве агента. В модели реализован механизм DeepSeek Sparse Attention (DSA) — мелкозернистое разреженное внимание, которое снижает затраты на обучение и инференс, сохраняя при этом качество работы в сценариях с длинным контекстом. Масштабируемая среда постобучения с помощью обучения с подкреплением значительно улучшает логические способности модели, демонстрируя производительность уровня GPT-5 и результаты на уровне золотых медалей на IMO и IOI 2025 года. V3.2 также использует крупномасштабный конвейер синтеза агентских задач для лучшей интеграции логических выводов в процессы использования инструментов, что повышает точность выполнения инструкций и обобщающую способность в интерактивных средах. Пользователи alltokens могут управлять поведением модели при рассуждении с помощью логического параметра reasoning enabled.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Модели для программирования

Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.

Смотреть подборку

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

DeepSeek: R1 Distill Llama 70B

Поддерживаемые параметры

Активность

Доступность

Провайдеры для DeepSeek: R1 Distill Llama 70B

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости