Alltokens

LiquidAI: LFM2-24B-A2B

LILiquidОбновлено: 25 февраля 2026 г.

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Использовать через API

Метрики

Вход

5 ₽/M

Выход

17 ₽/M

Контекст

33k tokens

Параметры

10

Релиз

25 февраля 2026 г.

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltystoptemperaturetop_ktop_p

Технический обзор

LFM2-24B-A2B — самая крупная модель в семействе гибридных архитектур LFM2, разработанная для эффективного развертывания на локальных устройствах. Она построена по принципу смеси экспертов (Mixture-of-Experts) с общим объемом 24 миллиарда параметров, из которых для обработки каждого токена активируются только 2 миллиарда. Это обеспечивает высокое качество генерации при сохранении низких затрат на инференс. Модель помещается в 32 ГБ оперативной памяти, что позволяет запускать ее на потребительских ноутбуках и настольных компьютерах без потери производительности. На alltokens вы можете получить доступ к этой модели через API.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

LFM2-24B-A2B — это инновационная гибридная модель на 24 млрд параметров, использующая архитектуру Mixture-of-Experts с 2 млрд активных параметров. Она оптимизирована для работы на потребительских устройствах с 32 ГБ ОЗУ, обеспечивая высокую скорость генерации при низких затратах.

Контекст

33k

Цена ₽

5 / 17

Для чего

Обе модели ориентированы на высокую эффективность и имеют схожую бюджетную стоимость токенов для экономичного внедрения.

Контекст

131k

Цена ₽

3 / 15

Для чего

Близкое количество параметров и сопоставимая цена за миллион токенов делают их прямыми конкурентами в сегменте компактных производительных решений.

Контекст

131k

Цена ₽

5 / 15

Когда выбирать

  • Необходима высокая производительность при ограниченных вычислительных ресурсах и малом объеме памяти
  • Требуется минимизировать затраты на инференс без значительной потери качества генерации текста
  • Нужна модель с поддержкой широкого спектра параметров управления генерацией, таких как frequency_penalty и logit_bias

Когда не выбирать

  • Для работы с контекстом, значительно превышающим лимит в 32 768 токенов
  • Если требуются мультимодальные возможности, так как модель работает только в режиме текст-в-текст
  • В задачах, где необходима максимальная точность огромных моделей уровня 200B+ активных параметров

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.