Alltokens

Reka Flash 3

RERekaaiОбновлено: 12 марта 2025 г.

Reka Flash 3 — это компактная модель на 21 миллиард параметров, оптимизированная для высокой скорости работы и точного следования инструкциям. Благодаря поддержке явных тегов рассуждения и эффективному квантованию, она обеспечивает производительность уровня проприетарных систем при низких задержках.

Использовать через API

Метрики

Вход

14 ₽/M

Выход

27 ₽/M

Контекст

66k tokens

Параметры

10

Релиз

12 марта 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningseedstoptemperaturetop_ktop_p

Технический обзор

Reka Flash 3 is a general-purpose, instruction-tuned large language model with 21 billion parameters, developed by Reka. It excels at general chat, coding tasks, instruction-following, and function calling. Featuring a 32K context length and optimized through reinforcement learning (RLOO), it provides competitive performance comparable to proprietary models within a smaller parameter footprint. Ideal for low-latency, local, or on-device deployments, Reka Flash 3 is compact, supports efficient quantization (down to 11GB at 4-bit precision), and employs explicit reasoning tags ("<reasoning>") to indicate its internal thought process. Reka Flash 3 is primarily an English model with limited multilingual understanding capabilities. The model weights are released under the Apache 2.0 license.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Reka Flash 3Текущая

Для чего

Reka Flash 3 — это компактная модель на 21 миллиард параметров, оптимизированная для высокой скорости работы и точного следования инструкциям. Благодаря поддержке явных тегов рассуждения и эффективному квантованию, она обеспечивает производительность уровня проприетарных систем при низких задержках.

Контекст

66k

Цена ₽

14 / 27

Для чего

Обе модели используют механизмы внутреннего рассуждения для повышения качества ответов и имеют схожую ценовую категорию на alltokens.

Контекст

66k

Цена ₽

17 / 27

Для чего

Ориентированы на эффективное выполнение инструкций и оптимизированы для задач, требующих высокой точности при умеренном количестве параметров.

Контекст

33k

Цена ₽

21 / 21

Когда выбирать

  • Необходима высокая скорость генерации и низкая задержка при выполнении задач.
  • Требуется модель с поддержкой цепочки рассуждений через теги <reasoning>.
  • Планируется локальное развертывание или использование на устройствах с ограниченной памятью (до 11 ГБ при 4-битном квантовании).

Когда не выбирать

  • Основная задача требует глубокого понимания языков, отличных от английского.
  • Необходима работа с очень длинными документами, превышающими контекст в 32K-64K токенов.
  • Требуется обработка мультимодальных данных, таких как изображения или аудио.

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.