Alltokens

Z.ai: GLM 4.5V

Z-Z-aiОбновлено: 11 августа 2025 г.

GLM-4.5V представляет собой передовую мультимодальную модель на архитектуре Mixture-of-Experts, оптимизированную для работы с видео и изображениями. Благодаря 106 миллиардам параметров она демонстрирует высокую точность в анализе визуального контента и создании сложных мультимодальных агентов.

Использовать через API

Метрики

Вход

72 ₽/M

Выход

216 ₽/M

Контекст

66k tokens

Параметры

13

Релиз

11 августа 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyseedstoptemperaturetool_choicetoolstop_ktop_p

Технический обзор

GLM-4.5V — это базовая мультимодальная модель, предназначенная для создания ИИ-агентов. Построенная на архитектуре Mixture-of-Experts с общим числом параметров 106 млрд и 12 млрд активируемых параметров, она демонстрирует передовые результаты в понимании видео, ответах на вопросы по изображениям, распознавании текста и парсинге документов. Модель значительно улучшена в задачах фронтенд-разработки, локализации объектов и пространственного мышления. Поддерживается гибридный режим работы: режим глубоких рассуждений для сложных задач и стандартный режим для быстрых ответов. Управление логикой рассуждений осуществляется через логический параметр reasoning enabled в API alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Z.ai: GLM 4.5VТекущая

Для чего

GLM-4.5V представляет собой передовую мультимодальную модель на архитектуре Mixture-of-Experts, оптимизированную для работы с видео и изображениями. Благодаря 106 миллиардам параметров она демонстрирует высокую точность в анализе визуального контента и создании сложных мультимодальных агентов.

Контекст

66k

Цена ₽

72 / 216

Для чего

Обе модели поддерживают мультимодальный ввод и ориентированы на высокую производительность в задачах среднего и продвинутого уровня сложности.

Контекст

131k

Цена ₽

48 / 240

Модель

Для чего

Является прямым конкурентом в сегменте мультимодальных моделей с поддержкой анализа изображений и текста.

Контекст

66k

Цена ₽

71 / 177

Когда выбирать

  • Необходим глубокий анализ видеоконтента и понимание динамических сцен
  • Требуется создание автономных мультимодальных агентов на базе архитектуры MoE
  • Нужна высокая точность в задачах, объединяющих визуальное восприятие и текстовую логику

Когда не выбирать

  • Работа с исключительно длинными текстовыми документами, превышающими лимит в 64k токенов
  • Задачи, требующие минимальной задержки при обработке только текстовых данных без изображений
  • Проекты с жестким ограничением на использование моделей с большим количеством параметров

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru