Alltokens

Arcee AI: Trinity Mini

ARArcee-aiОбновлено: 01 декабря 2025 г.

Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.

Использовать через API

Метрики

Вход

6 ₽/M

Выход

19 ₽/M

Контекст

131k tokens

Параметры

11

Релиз

01 декабря 2025 г.

Поддерживаемые параметры

include_reasoningmax_completion_tokensmax_tokensreasoningresponse_formatstopstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

Trinity Mini — это языковая модель с архитектурой разреженной смеси экспертов (MoE) на 26 миллиардов параметров, из которых 3 миллиарда активны. Модель использует 128 экспертов, из которых 8 активируются для каждого токена. Разработана для эффективных рассуждений в рамках длинного контекста до 131 000 токенов, обладает развитыми возможностями вызова функций и поддерживает сложные многоэтапные рабочие процессы агентов. Доступна через API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.

Контекст

131k

Цена ₽

6 / 19

Для чего

Обе модели ориентированы на высокую эффективность и скорость работы при сохранении компактного размера.

Контекст

131k

Цена ₽

5 / 20

Модель

Для чего

Схожий объем параметров и фокус на качественную обработку контекста средней и большой длины.

Контекст

128k

Цена ₽

13 / 13

Когда выбирать

  • Необходима обработка больших объемов текста до 131 тысячи токенов
  • Требуется надежная работа с инструментами и вызовом функций (function calling)
  • Нужна высокая скорость генерации при использовании архитектуры Mixture-of-Experts

Когда не выбирать

  • Требуется выполнение сложнейших логических задач, доступных только флагманским моделям
  • Необходима работа с мультимодальным контентом, таким как изображения или видео
  • Задачи требуют глубоких экспертных знаний в узкоспециализированных научных областях

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru