Каковы системные требования для запуска LFM2-24B-A2B?

Благодаря архитектуре MoE с 2 млрд активных параметров, модель эффективно работает на устройствах с 32 ГБ оперативной памяти, включая современные ноутбуки.

Какова стоимость использования модели через alltokens?

Цена составляет 4 рубля за 1 миллион токенов на входе и 15 рублей за 1 миллион токенов на выходе.

Какую длину контекста поддерживает эта модель?

Модель поддерживает контекстное окно размером до 32 768 токенов, что достаточно для обработки объемных документов и длинных диалогов.

LiquidAI: LFM2-24B-A2B

LILiquidОбновлено: 25 февраля 2026 г.

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Использовать через API

Метрики

Вход

4 ₽/M

Выход

15 ₽/M

Контекст

128k tokens

Параметры

Релиз

25 февраля 2026 г.

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltystoptemperaturetop_ktop_p

Технический обзор

LFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, разработанная для эффективного развертывания на локальных устройствах. Она построена по принципу смеси экспертов (Mixture-of-Experts) с общим объемом 24 миллиарда параметров, из которых для обработки каждого токена активируются только 2 миллиарда. Это обеспечивает высокое качество генерации при сохранении низких затрат на инференс. Модель помещается в 32 ГБ оперативной памяти, что позволяет запускать ее на потребительских ноутбуках и настольных компьютерах без потери производительности. На alltokens вы можете получить доступ к этой модели через API.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

LiquidAI: LFM2-24B-A2BТекущая

Для чего

Контекст

128k

Цена ₽

4 / 15

LiquidAI: LFM2-24B-A2BТекущая

128k

4 / 15

Модель

IBM: Granite 4.0 Micro

Для чего

Обе модели ориентированы на высокую эффективность и имеют схожую бюджетную стоимость токенов для экономичного внедрения.

Контекст

131k

Цена ₽

3 / 14

IBM: Granite 4.0 Micro

131k

3 / 14

Модель

OpenAI: gpt-oss-20b

Для чего

Близкое количество параметров и сопоставимая цена за миллион токенов делают их прямыми конкурентами в сегменте компактных производительных решений.

Контекст

131k

Цена ₽

4 / 18

OpenAI: gpt-oss-20b

131k

4 / 18

Когда выбирать

Необходима высокая производительность при ограниченных вычислительных ресурсах и малом объеме памяти
Требуется минимизировать затраты на инференс без значительной потери качества генерации текста
Нужна модель с поддержкой широкого спектра параметров управления генерацией, таких как frequency_penalty и logit_bias

Когда не выбирать

Для работы с контекстом, значительно превышающим лимит в 32 768 токенов
Если требуются мультимодальные возможности, так как модель работает только в режиме текст-в-текст
В задачах, где необходима максимальная точность огромных моделей уровня 200B+ активных параметров