Alltokens

Z.ai: GLM 4.6V

Z-Z-aiОбновлено: 08 декабря 2025 г.

GLM-4.6V — это мощная мультимодальная модель, специализирующаяся на глубоком анализе визуального контента и работе с длинными контекстами до 128K токенов. Она отлично справляется с распознаванием сложных макетов документов, анализом видео и извлечением данных из смешанных медиа-форматов.

Использовать через API

Метрики

Вход

38 ₽/M

Выход

112 ₽/M

Контекст

131k tokens

Параметры

13

Релиз

08 декабря 2025 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyseedstoptemperaturetool_choicetoolstop_ktop_p

Технический обзор

GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточного визуального анализа и логических рассуждений в длинном контексте, охватывающем изображения, документы и смешанные медиаданные. Она поддерживает контекстное окно до 128K токенов, напрямую обрабатывает сложные макеты страниц и диаграммы в качестве визуальных входных данных, а также интегрирует нативный мультимодальный вызов функций для связи визуального восприятия с выполнением внешних инструментов. Модель поддерживает генерацию чередующегося текста и изображений, а также рабочие процессы по реконструкции пользовательских интерфейсов, включая синтез HTML-кода по скриншотам и итеративное визуальное редактирование.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Z.ai: GLM 4.6VТекущая

Для чего

GLM-4.6V — это мощная мультимодальная модель, специализирующаяся на глубоком анализе визуального контента и работе с длинными контекстами до 128K токенов. Она отлично справляется с распознаванием сложных макетов документов, анализом видео и извлечением данных из смешанных медиа-форматов.

Контекст

131k

Цена ₽

38 / 112

Для чего

Обе модели поддерживают мультимодальный ввод (текст, изображения, видео) и ориентированы на высокую точность визуального распознавания.

Контекст

262k

Цена ₽

18 / 125

Для чего

Являются конкурентами в сегменте эффективных визуально-языковых моделей для анализа графики и видеоконтента.

Контекст

131k

Цена ₽

25 / 75

Когда выбирать

  • Необходим детальный анализ сложных документов с нестандартной версткой и таблицами
  • Требуется обработка длинных текстовых запросов в сочетании с визуальными данными до 128K токенов
  • Нужна высокая точность в задачах понимания видео и динамических сцен

Когда не выбирать

  • Требуется работа исключительно с текстовыми данными без визуальной составляющей
  • Необходима генерация изображений или видео, так как модель работает только на выходной текст
  • Задачи ограничены простыми чат-ботами, где не используются возможности мультимодальности

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru