Что такое архитектура MoE в Trinity Mini?

Это архитектура «смеси экспертов», где из 26 миллиардов параметров для каждого токена активируются только 3 миллиарда, что обеспечивает высокую скорость работы при сохранении качества ответов.

Какой максимальный объем текста может обработать модель?

Модель поддерживает контекстное окно до 131 072 токенов, что позволяет анализировать целые книги или длинные технические документы.

Поддерживает ли модель структурированные ответы?

Да, Trinity Mini поддерживает структурированный вывод данных и работу с инструментами, что делает её отличным выбором для автоматизации рабочих процессов через alltokens.

Arcee AI: Trinity Mini

ARArcee-aiОбновлено: 01 декабря 2025 г.

Trinity Mini — это компактная модель на 26 миллиардов параметров с архитектурой MoE, оптимизированная для работы с длинными контекстами до 131 тысячи токенов. Она сочетает в себе высокую скорость работы благодаря малому числу активных параметров и продвинутые возможности вызова функций.

Использовать через API

Метрики

Вход

6 ₽/M

Выход

19 ₽/M

Контекст

131k tokens

Параметры

Релиз

01 декабря 2025 г.

Поддерживаемые параметры

include_reasoningmax_completion_tokensmax_tokensreasoningresponse_formatstopstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

Trinity Mini — это языковая модель с архитектурой разреженной смеси экспертов (MoE) на 26 миллиардов параметров, из которых 3 миллиарда активны. Модель использует 128 экспертов, из которых 8 активируются для каждого токена. Разработана для эффективных рассуждений в рамках длинного контекста до 131 000 токенов, обладает развитыми возможностями вызова функций и поддерживает сложные многоэтапные рабочие процессы агентов. Доступна через API alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Arcee AI: Trinity MiniТекущая

Для чего

Контекст

131k

Цена ₽

6 / 19

Arcee AI: Trinity MiniТекущая

131k

6 / 19

Модель

NVIDIA: Nemotron Nano 9B V2

Для чего

Обе модели ориентированы на высокую эффективность и скорость работы при сохранении компактного размера.

Контекст

131k

Цена ₽

5 / 20

NVIDIA: Nemotron Nano 9B V2

Обе модели ориентированы на высокую эффективность и скорость работы при сохранении компактного размера.

131k

5 / 20

Модель

Z.ai: GLM 4 32B

Для чего

Схожий объем параметров и фокус на качественную обработку контекста средней и большой длины.

Контекст

128k

Цена ₽

13 / 13

Z.ai: GLM 4 32B

Схожий объем параметров и фокус на качественную обработку контекста средней и большой длины.

128k

13 / 13

Когда выбирать

Необходима обработка больших объемов текста до 131 тысячи токенов
Требуется надежная работа с инструментами и вызовом функций (function calling)
Нужна высокая скорость генерации при использовании архитектуры Mixture-of-Experts

Когда не выбирать

Требуется выполнение сложнейших логических задач, доступных только флагманским моделям
Необходима работа с мультимодальным контентом, таким как изображения или видео
Задачи требуют глубоких экспертных знаний в узкоспециализированных научных областях