Чем DeepSeek R1 Distill Qwen 32B отличается от базовой Qwen 2.5?

Она прошла этап дообучения на данных, сгенерированных моделью DeepSeek R1, что значительно улучшило её способности к рассуждению и решению сложных проблем.

Поддерживает ли модель структурированный вывод данных?

Да, через alltokens доступны параметры structured_outputs и response_format для получения ответов в строгом формате, например JSON.

Можно ли использовать эту модель для написания кода?

Да, благодаря архитектуре Qwen и дистилляции логики R1, модель отлично справляется с программированием и отладкой алгоритмов.

DeepSeek: R1 Distill Qwen 32B

DeepseekОбновлено: 29 января 2025 г.

DeepSeek R1 Distill Qwen 32B — это дистиллированная модель на базе архитектуры Qwen 2.5, обученная на ответах флагманской DeepSeek R1. Она демонстрирует выдающиеся результаты в логических рассуждениях и математических задачах, превосходя многие компактные модели в тестах на производительность.

Использовать через API

Метрики

Вход

37 ₽/M

Выход

37 ₽/M

Контекст

128k tokens

Параметры

Релиз

29 января 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogprobsmax_tokenspresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetop_logprobstop_p

Технический обзор

DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель, основанная на архитектуре Qwen 2.5 32B и обученная на ответах DeepSeek R1. Она превосходит OpenAI o1-mini в различных тестах, устанавливая новые стандарты производительности для плотных моделей. Результаты тестирования модели: AIME 2024 pass@1: 72.6 MATH-500 pass@1: 94.3 Рейтинг CodeForces: 1691 Благодаря тонкой настройке на данных DeepSeek R1, модель демонстрирует конкурентоспособные результаты, сопоставимые с показателями крупнейших передовых моделей. Доступ к модели осуществляется через API alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

DeepSeek: R1 Distill Qwen 32BТекущая

Для чего

Контекст

128k

Цена ₽

37 / 37

DeepSeek: R1 Distill Qwen 32BТекущая

128k

37 / 37

Модель

NVIDIA: Nemotron 3 Super

Для чего

Обе модели ориентированы на высокую точность в сложных текстовых задачах, при этом R1 Distill Qwen 32B использует методы дистилляции для оптимизации логики.

Контекст

Цена ₽

12 / 56

NVIDIA: Nemotron 3 Super

12 / 56

Модель

AI21: Jamba Mini 1.7

Для чего

Модели сопоставимы по компактности и направленности на эффективную обработку контекста при сохранении высокой скорости генерации.

Контекст

256k

Цена ₽