arcee-ai/virtuoso-largeVirtuoso-Large — это флагманская универсальная языковая модель от Arcee с 72 миллиардами параметров, оптимизированная для решения задач междисциплинарного логического вывода, креативного письма и корпоративных ответов на вопросы. В отличие от многих аналогов в категории 70B, она сохраняет контекстное окно в 128 000 токенов, унаследованное от архитектуры Qwen 2.5, что позволяет ей целиком обрабатывать книги, кодовые базы или финансовую отчетность. Процесс обучения включал дистилляцию знаний из DeepSeek R1, многоэтапную контролируемую тонкую настройку и финальную стадию выравнивания через DPO/RLHF, что обеспечило высокие результаты в тестах BIG-Bench-Hard, GSM-8K и испытаниях на поиск информации в длинном контексте. Компании используют Virtuoso-Large на платформе alltokens в качестве основного вычислительного узла в конвейерах Conductor, когда малые языковые модели показывают низкую уверенность в ответе. Несмотря на внушительный размер, агрессивная оптимизация KV-кэша позволяет сохранять задержку до генерации первого токена в пределах нескольких секунд на узлах с 8 картами H100, что делает модель практичным и мощным инструментом для промышленной эксплуатации.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "arcee-ai/virtuoso-large",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Arcee AI: Virtuoso Large от провайдера arcee-ai доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
131 072 токенов
Цена входа
101 ₽ / 1M токенов
Цена выхода
161 ₽ / 1M токенов
Входные модальности
Выходные модальности
Arcee AI: Trinity Large Thinking
arcee-ai
Trinity Large Thinking — это мощная открытая модель рассуждений от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских нагрузках и задачах рассуждения. В течение первых пяти дней доступна бесплатно в open claw. Запуск видео:
Arcee AI: Trinity Large Preview (Бесплатно)
arcee-ai
Trinity-Large-Preview — это передовая языковая модель с открытыми весами от компании Arcee, представляющая собой разреженную архитектуру смеси экспертов (MoE) на 400 миллиардов параметров. В процессе генерации на каждый токен активируется 13 миллиардов параметров благодаря системе маршрутизации 4 из 256 экспертов. Модель демонстрирует выдающиеся результаты в художественном письме, сторителлинге, ролевых играх, чат-сценариях и голосовых помощниках реального времени, превосходя в этих аспектах стандартные рассуждающие модели. Также Trinity-Large-Preview обладает улучшенными агентными способностями: она обучена эффективно работать в программных средах, управлять сложными цепочками инструментов и обрабатывать длинные промпты с большим количеством ограничений. Архитектура нативно поддерживает сверхдлинные контекстные окна до 512 000 токенов. В текущей версии API на alltokens доступен контекст объемом 128 000 токенов с использованием 8-битного квантования для оптимизации производительности. Trinity-Large-Preview воплощает философию проектирования Arcee, ориентированную на эффективность, предлагая готовую к промышленной эксплуатации модель с открытыми весами и гибкой лицензией для практического применения и экспериментов.
Добавлена в каталог
06.02.2026