Alltokens

DeepSeek: R1 Distill Qwen 32B

DeepseekDeepseekОбновлено: 29 января 2025 г.

DeepSeek R1 Distill Qwen 32B — это дистиллированная модель на базе архитектуры Qwen 2.5, обученная на ответах флагманской DeepSeek R1. Она демонстрирует выдающиеся результаты в логических рассуждениях и математических задачах, превосходя многие компактные модели в тестах на производительность.

Использовать через API

Метрики

Вход

37 ₽/M

Выход

37 ₽/M

Контекст

128k tokens

Параметры

14

Релиз

29 января 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogprobsmax_tokenspresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetop_logprobstop_p

Технический обзор

DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель, основанная на архитектуре Qwen 2.5 32B и обученная на ответах DeepSeek R1. Она превосходит OpenAI o1-mini в различных тестах, устанавливая новые стандарты производительности для плотных моделей. Результаты тестирования модели: AIME 2024 pass@1: 72.6 MATH-500 pass@1: 94.3 Рейтинг CodeForces: 1691 Благодаря тонкой настройке на данных DeepSeek R1, модель демонстрирует конкурентоспособные результаты, сопоставимые с показателями крупнейших передовых моделей. Доступ к модели осуществляется через API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

DeepSeek R1 Distill Qwen 32B — это дистиллированная модель на базе архитектуры Qwen 2.5, обученная на ответах флагманской DeepSeek R1. Она демонстрирует выдающиеся результаты в логических рассуждениях и математических задачах, превосходя многие компактные модели в тестах на производительность.

Контекст

128k

Цена ₽

37 / 37

Для чего

Обе модели ориентированы на высокую точность в сложных текстовых задачах, при этом R1 Distill Qwen 32B использует методы дистилляции для оптимизации логики.

Контекст

1M

Цена ₽

12 / 56

Для чего

Модели сопоставимы по компактности и направленности на эффективную обработку контекста при сохранении высокой скорости генерации.

Контекст

256k

Цена ₽

25 / 50

Когда выбирать

  • Необходима высокая точность в решении математических и логических задач
  • Требуется модель с глубоким пониманием структуры кода и программирования
  • Нужна производительность уровня o1-mini в более компактном формате

Когда не выбирать

  • Требуется работа с экстремально длинными документами свыше 32 тысяч токенов
  • Необходима мультимодальность, так как модель работает только с текстовым вводом
  • Нужна максимально простая творческая генерация без цепочки рассуждений

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru