Alltokens

Google: Gemma 4 26B A4B

GoogleGoogleОбновлено: 03 апреля 2026 г.

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Использовать через API

Метрики

Вход

18 ₽/M

Выход

54 ₽/M

Контекст

262k tokens

Параметры

16

Релиз

03 апреля 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biasmax_tokenspresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Технический обзор

Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференсе активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели, при значительно меньших вычислительных затратах. Поддерживает мультимодальные входные данные, включая текст, изображения и видео (до 60 секунд с частотой 1 кадр в секунду). Оснащена 256K контекстным окном, встроенным вызовом функций, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Контекст

262k

Цена ₽

18 / 54

Для чего

Старшая модель в линейке с аналогичными мультимодальными возможностями, но использующая более плотную архитектуру параметров.

Контекст

262k

Цена ₽

19 / 54

Для чего

Прямой конкурент в сегменте компактных мультимодальных моделей, также поддерживающий обработку видео и длинных контекстов.

Контекст

262k

Цена ₽

14 / 54

Когда выбирать

  • Необходим анализ видеофайлов длительностью до одной минуты напрямую через API.
  • Требуется работа с большими объемами документов благодаря контекстному окну 256K.
  • Нужна высокая скорость генерации при сохранении качества ответов уровня 31B моделей.

Когда не выбирать

  • Требуется работа исключительно с текстовыми данными без мультимодальных функций.
  • Необходима максимальная точность в узкоспециализированных задачах, где эффективнее полноразмерные модели.
  • Задачи не подразумевают использование структурированного вывода или вызова функций.

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.