Alltokens

Meituan: LongCat Flash Chat

MEMeituanОбновлено: 09 сентября 2025 г.

Meituan: LongCat Flash Chat — это масштабная модель на архитектуре Mixture-of-Experts (MoE) с 560 миллиардами параметров, оптимизированная для быстрой обработки данных. Благодаря инновационной структуре с сокращенными соединениями, она обеспечивает высокую производительность при работе с длинными контекстами до 128k токенов.

Использовать через API

Метрики

Вход

25 ₽/M

Выход

100 ₽/M

Контекст

131k tokens

Параметры

15

Релиз

09 сентября 2025 г.

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Технический обзор

LongCat-Flash-Chat — это крупномасштабная модель с архитектурой смеси экспертов (MoE), содержащая в общей сложности 560 миллиардов параметров. Для обработки каждого входного сигнала динамически активируется от 18,6 до 31,3 миллиарда параметров (в среднем около 27 миллиардов). В модели реализована архитектура MoE с прямыми соединениями (shortcut-connected), что снижает затраты на передачу данных и обеспечивает высокую пропускную способность. Стабильность обучения достигается за счет передовых стратегий масштабирования, включая перенос гиперпараметров, детерминированные вычисления и многоэтапную оптимизацию. Данная версия LongCat-Flash-Chat представляет собой базовую модель без механизмов «рассуждения» (non-thinking), оптимизированную для диалоговых задач и работы в качестве ИИ-агента. Модель поддерживает длинный контекст до 128 000 токенов и демонстрирует конкурентные результаты в тестах на логику, написание кода и следование инструкциям. Особое преимущество модели проявляется в использовании инструментов и сложных многошаговых взаимодействиях. Доступ к модели осуществляется через API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Meituan: LongCat Flash Chat — это масштабная модель на архитектуре Mixture-of-Experts (MoE) с 560 миллиардами параметров, оптимизированная для быстрой обработки данных. Благодаря инновационной структуре с сокращенными соединениями, она обеспечивает высокую производительность при работе с длинными контекстами до 128k токенов.

Контекст

131k

Цена ₽

25 / 100

Для чего

Обе модели используют архитектуру MoE и ориентированы на высокую эффективность в задачах общего назначения и программирования.

Контекст

164k

Цена ₽

34 / 118

Для чего

Модели сопоставимы по производительности и возможностям обработки сложных текстовых запросов в рамках современных нейросетевых решений.

Контекст

128k

Цена ₽

32 / 94

Когда выбирать

  • Необходима обработка объемных документов с контекстом до 131 072 токенов
  • Требуется высокая скорость генерации благодаря оптимизированной архитектуре MoE
  • Нужна поддержка структурированных выходных данных и инструментов (tools) для автоматизации задач

Когда не выбирать

  • Требуется работа с мультимодальным контентом, таким как изображения или видео
  • Необходима модель с минимальным общим количеством параметров для локального развертывания
  • Задачи ограничены короткими диалогами, где не раскрываются преимущества длинного контекста

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru