Alltokens

Z.ai: GLM 4.5 Air

Z-Z-aiОбновлено: 25 июля 2025 г.

GLM-4.5-Air — это облегченная версия флагманской модели, использующая архитектуру Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Использовать через API

Метрики

Вход

17 ₽/M

Выход

106 ₽/M

Контекст

131k tokens

Параметры

13

Релиз

25 июля 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyseedstoptemperaturetool_choicetoolstop_ktop_p

Технический обзор

GLM-4.5-Air — это облегченная версия флагманского семейства моделей, специально разработанная для работы в качестве автономных агентов. Как и основная модель GLM-4.5, она использует архитектуру Mixture-of-Experts (MoE), но обладает более компактным количеством параметров. GLM-4.5-Air поддерживает гибридные режимы инференса: «режим размышления» для сложного логического вывода и работы с инструментами, а также стандартный режим для взаимодействия в реальном времени. Пользователи могут управлять поведением модели при рассуждении с помощью логического параметра reasoning enabled в API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Z.ai: GLM 4.5 AirТекущая

Для чего

GLM-4.5-Air — это облегченная версия флагманской модели, использующая архитектуру Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Контекст

131k

Цена ₽

17 / 106

Для чего

Обе модели используют архитектуру MoE и ориентированы на высокую скорость генерации при сохранении качества ответов.

Контекст

164k

Цена ₽

27 / 99

Для чего

Являются конкурентами в сегменте компактных, но мощных моделей для интеграции в сложные программные системы.

Контекст

128k

Цена ₽

32 / 94

Когда выбирать

  • Разработка автономных ИИ-агентов, требующих быстрого принятия решений
  • Обработка и анализ длинных документов объемом до 128 тысяч токенов
  • Задачи, требующие строгого соблюдения структуры выходных данных через structured_outputs

Когда не выбирать

  • Необходимость работы с мультимодальным контентом, таким как изображения или видео
  • Задачи, требующие максимальной вычислительной мощности тяжелых флагманских моделей без ограничений по весу
  • Сценарии, где не требуется поддержка сложной логики ИИ-агентов

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru