Каков размер контекстного окна Reka Flash 3?

Модель поддерживает контекст длиной до 65 536 токенов, что позволяет обрабатывать объемные текстовые данные и сложные инструкции.

Можно ли использовать Reka Flash 3 для написания кода?

Да, модель специально обучена для решения задач программирования и демонстрирует отличные результаты в написании и анализе кода.

Под какими условиями распространяется эта модель?

Веса Reka Flash 3 выпущены под лицензией Apache 2.0, что позволяет использовать её в различных проектах, включая коммерческие.

Reka Flash 3

RERekaaiОбновлено: 12 марта 2025 г.

Reka Flash 3 — это компактная модель на 21 миллиард параметров, оптимизированная для высокой скорости работы и точного следования инструкциям. Благодаря поддержке явных тегов рассуждения и эффективному квантованию, она обеспечивает производительность уровня проприетарных систем при низких задержках.

Использовать через API

Метрики

Вход

13 ₽/M

Выход

25 ₽/M

Контекст

66k tokens

Параметры

Релиз

12 марта 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogprobsmax_tokenspresence_penaltyreasoningseedstopstructured_outputstemperaturetop_ktop_logprobstop_p

Технический обзор

Reka Flash 3 — это универсальная языковая модель с 21 миллиардом параметров, разработанная компанией Reka. Она отлично справляется с общими чат-задачами, программированием, выполнением инструкций и вызовом функций.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Reka Flash 3Текущая

Для чего

Контекст

66k

Цена ₽

13 / 25

Reka Flash 3Текущая

66k

13 / 25

Модель

allenai/olmo-3-7b-think

Для чего

Обе модели используют механизмы внутреннего рассуждения для повышения качества ответов и имеют схожую ценовую категорию на alltokens.

Контекст

—

Цена ₽

— / —

allenai/olmo-3-7b-think

—

— / —

Модель

essentialai/rnj-1-instruct

Для чего

Ориентированы на эффективное выполнение инструкций и оптимизированы для задач, требующих высокой точности при умеренном количестве параметров.

Контекст

—

Цена ₽

— / —

essentialai/rnj-1-instruct

—

— / —

Когда выбирать

Необходима высокая скорость генерации и низкая задержка при выполнении задач.
Требуется модель с поддержкой цепочки рассуждений через теги <reasoning>.
Планируется локальное развертывание или использование на устройствах с ограниченной памятью (до 11 ГБ при 4-битном квантовании).

Когда не выбирать

Основная задача требует глубокого понимания языков, отличных от английского.
Необходима работа с очень длинными документами, превышающими контекст в 32K-64K токенов.
Требуется обработка мультимодальных данных, таких как изображения или аудио.