deepseek/deepseek-r1-distill-llama-70bDeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, созданная на базе Llama-3.3-70B-Instruct с использованием выходных данных DeepSeek R1. Модель сочетает в себе передовые методы дистилляции для достижения высокой производительности в различных тестах, включая:
Благодаря тонкой настройке на результатах DeepSeek R1, модель демонстрирует конкурентоспособную эффективность, сопоставимую с крупнейшими флагманскими моделями. На alltokens вы можете получить доступ к возможностям этой модели через API.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek/deepseek-r1-distill-llama-70b",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'DeepSeek: R1 Distill Llama 70B от провайдера deepseek доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
131 072 токенов
Цена входа
87 ₽ / 1M токенов
Цена выхода
100 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
DeepSeek: DeepSeek V4 Pro
deepseek
DeepSeek V4 Pro is a large-scale Mixture-of-Experts model from DeepSeek with 1.6T total parameters and 49B activated parameters, supporting a 1M-token context window. It is designed for advanced reasoning, coding,...
DeepSeek: DeepSeek V4 Flash (Бесплатно)
deepseek
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим числом параметров 284 миллиарда и 13 миллиардами активируемых параметров, поддерживающая контекстное окно в 1 миллион токенов. Модель разработана для быстрого вывода и...
DeepSeek: DeepSeek V4 Flash
deepseek
DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...