Alltokens

Z.ai: GLM 4.5 Air (Бесплатно)

Z-Z-aiОбновлено: 25 июля 2025 г.

GLM-4.5-Air — это облегченная версия флагманской модели, построенная на архитектуре Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Использовать через API

Метрики

Вход

₽/M

Выход

₽/M

Контекст

131k tokens

Параметры

7

Релиз

25 июля 2025 г.

Поддерживаемые параметры

include_reasoningmax_tokensreasoningtemperaturetool_choicetoolstop_p

Технический обзор

GLM-4.5-Air — это облегченная версия флагманского семейства моделей, специально разработанная для работы в качестве ИИ-агентов. Как и основная модель GLM-4.5, она использует архитектуру Mixture-of-Experts (MoE), но обладает более компактным количеством параметров. GLM-4.5-Air поддерживает гибридные режимы инференса: режим мышления для сложного логического вывода и использования инструментов, а также обычный режим для взаимодействия в реальном времени. Пользователи могут управлять поведением модели с помощью логического параметра reasoning enabled через API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

GLM-4.5-Air — это облегченная версия флагманской модели, построенная на архитектуре Mixture-of-Experts (MoE) для высокой производительности. Она специально оптимизирована для работы в качестве ИИ-агента и поддерживает внушительное контекстное окно в 128 тысяч токенов.

Контекст

131k

Цена ₽

— / —

Для чего

Обе модели являются передовыми китайскими разработками с бесплатным доступом на alltokens и ориентированы на универсальное применение.

Контекст

1M

Цена ₽

— / —

Для чего

Конкурирует в сегменте эффективных моделей среднего размера, предлагая баланс между скоростью генерации и качеством ответов.

Контекст

205k

Цена ₽

— / —

Когда выбирать

  • Необходима разработка автономных ИИ-агентов и сложных сценариев автоматизации
  • Требуется обработка больших объемов текста до 128к токенов в рамках одного запроса
  • Нужна современная архитектура MoE для получения точных ответов при высокой скорости работы

Когда не выбирать

  • Требуется работа с мультимодальными данными, такими как изображения или видео
  • Необходима максимально тяжелая флагманская модель для решения сверхсложных научных задач
  • Задачи ограничены короткими промптами, где преимущества большого контекста не будут задействованы

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru