Что означает приставка Air в названии GLM-4.5?

Это указывает на облегченную и оптимизированную версию модели, которая сохраняет ключевые возможности флагмана, но работает быстрее за счет компактного количества параметров.

Подходит ли GLM-4.5 Air для написания кода?

Да, благодаря архитектуре MoE и глубокому пониманию логики, модель эффективно справляется с задачами программирования и отладки через alltokens.

Каков максимальный объем текста, который может обработать модель?

Модель поддерживает контекстное окно до 131 072 токенов, что позволяет анализировать целые книги или объемную техническую документацию.

Z.ai: GLM 4.5 Air (Бесплатно)

Z-Z-aiОбновлено: 25 июля 2025 г.

GLM-4.5-Air — это облегченная версия флагманской модели, построенная на архитектуре Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Использовать через API

Метрики

Вход

— ₽/M

Выход

— ₽/M

Контекст

131k tokens

Параметры

Релиз

25 июля 2025 г.

Поддерживаемые параметры

include_reasoningmax_tokensreasoningtemperaturetool_choicetoolstop_p

Технический обзор

GLM-4.5-Air — это облегченная версия флагманского семейства моделей, специально разработанная для работы в качестве ИИ-агентов. Как и основная модель GLM-4.5, она использует архитектуру Mixture-of-Experts (MoE), но обладает более компактным количеством параметров. GLM-4.5-Air поддерживает гибридные режимы инференса: режим мышления для сложного логического вывода и использования инструментов, а также обычный режим для взаимодействия в реальном времени. Пользователи могут управлять поведением модели с помощью логического параметра reasoning enabled через API alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Z.ai: GLM 4.5 Air (Бесплатно)Текущая

Для чего

Контекст

131k

Цена ₽

— / —

Z.ai: GLM 4.5 Air (Бесплатно)Текущая

131k

— / —

Модель

Qwen: Qwen3.6 Plus Preview (Бесплатно)

Для чего

Обе модели являются передовыми китайскими разработками с бесплатным доступом на alltokens и ориентированы на универсальное применение.

Контекст

Цена ₽

— / —

Qwen: Qwen3.6 Plus Preview (Бесплатно)

— / —

Модель

MiniMax: MiniMax M2.5 (Бесплатно)

Для чего

Конкурирует в сегменте эффективных моделей среднего размера, предлагая баланс между скоростью генерации и качеством ответов.

Контекст

205k

Цена ₽

— / —

MiniMax: MiniMax M2.5 (Бесплатно)

205k

— / —

Когда выбирать

Необходима разработка автономных ИИ-агентов и сложных сценариев автоматизации
Требуется обработка больших объемов текста до 128к токенов в рамках одного запроса
Нужна современная архитектура MoE для получения точных ответов при высокой скорости работы

Когда не выбирать

Требуется работа с мультимодальными данными, такими как изображения или видео
Необходима максимально тяжелая флагманская модель для решения сверхсложных научных задач
Задачи ограничены короткими промптами, где преимущества большого контекста не будут задействованы