Каков объем контекстного окна у LongCat Flash Chat?

Модель поддерживает контекстное окно размером до 131 072 токенов, что позволяет анализировать целые книги или крупные репозитории кода.

В чем особенность архитектуры этой модели?

Она использует дизайн Mixture-of-Experts (MoE) с 560 млрд параметров, где для каждого запроса динамически активируется в среднем около 27 млрд параметров, что ускоряет работу без потери качества.

Можно ли использовать модель через alltokens?

Да, модель Meituan: LongCat Flash Chat доступна для интеграции и использования через платформу alltokens с поддержкой всех основных параметров генерации.

Meituan: LongCat Flash Chat

MEMeituanОбновлено: 09 сентября 2025 г.

Meituan: LongCat Flash Chat — это масштабная модель на архитектуре Mixture-of-Experts (MoE) с 560 миллиардами параметров, оптимизированная для быстрой обработки данных. Благодаря инновационной структуре с сокращенными соединениями, она обеспечивает высокую производительность при работе с длинными контекстами до 128k токенов.

Использовать через API

Метрики

Вход

25 ₽/M

Выход

100 ₽/M

Контекст

131k tokens

Параметры

Релиз

09 сентября 2025 г.

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Технический обзор

LongCat-Flash-Chat — это крупномасштабная модель с архитектурой смеси экспертов (MoE), содержащая в общей сложности 560 миллиардов параметров. Для обработки каждого входного сигнала динамически активируется от 18,6 до 31,3 миллиарда параметров (в среднем около 27 миллиардов). В модели реализована архитектура MoE с прямыми соединениями (shortcut-connected), что снижает затраты на передачу данных и обеспечивает высокую пропускную способность. Стабильность обучения достигается за счет передовых стратегий масштабирования, включая перенос гиперпараметров, детерминированные вычисления и многоэтапную оптимизацию. Данная версия LongCat-Flash-Chat представляет собой базовую модель без механизмов «рассуждения» (non-thinking), оптимизированную для диалоговых задач и работы в качестве ИИ-агента. Модель поддерживает длинный контекст до 128 000 токенов и демонстрирует конкурентные результаты в тестах на логику, написание кода и следование инструкциям. Особое преимущество модели проявляется в использовании инструментов и сложных многошаговых взаимодействиях. Доступ к модели осуществляется через API alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Meituan: LongCat Flash ChatТекущая

Для чего

Контекст

131k

Цена ₽

25 / 100

Meituan: LongCat Flash ChatТекущая

131k

25 / 100

Модель

DeepSeek: DeepSeek V3.1 Terminus

Для чего

Обе модели используют архитектуру MoE и ориентированы на высокую эффективность в задачах общего назначения и программирования.

Контекст

164k

Цена ₽

34 / 118

DeepSeek: DeepSeek V3.1 Terminus

164k

34 / 118

Модель

Inception: Mercury 2

Для чего

Модели сопоставимы по производительности и возможностям обработки сложных текстовых запросов в рамках современных нейросетевых решений.

Контекст

128k

Цена ₽

32 / 94

Inception: Mercury 2

128k

32 / 94

Когда выбирать

Необходима обработка объемных документов с контекстом до 131 072 токенов
Требуется высокая скорость генерации благодаря оптимизированной архитектуре MoE
Нужна поддержка структурированных выходных данных и инструментов (tools) для автоматизации задач

Когда не выбирать

Требуется работа с мультимодальным контентом, таким как изображения или видео
Необходима модель с минимальным общим количеством параметров для локального развертывания
Задачи ограничены короткими диалогами, где не раскрываются преимущества длинного контекста