Какие типы данных поддерживает Gemma 4 26B A4B?

Модель является мультимодальной и способна обрабатывать текст, изображения, а также видеоролики продолжительностью до 60 секунд с частотой 1 кадр в секунду.

В чем преимущество архитектуры MoE в этой модели?

Благодаря архитектуре Mixture-of-Experts, при общем объеме в 25.2 млрд параметров, для каждого токена активируется только 3.8 млрд, что значительно ускоряет работу без потери качества.

Можно ли использовать модель для сложных технических задач на alltokens?

Да, модель поддерживает нативный вызов функций, структурированный вывод и имеет настраиваемый режим рассуждений, что делает её подходящей для программирования и аналитики.

Google: Gemma 4 26B A4B

GoogleОбновлено: 03 апреля 2026 г.

Gemma 4 26B A4B — это эффективная мультимодальная модель от Google DeepMind, использующая архитектуру Mixture-of-Experts для быстрой обработки данных. Она поддерживает работу с текстом, изображениями и видео до 60 секунд, предлагая внушительное контекстное окно в 256K токенов.

Использовать через API

Метрики

Вход

8 ₽/M

Выход

38 ₽/M

Контекст

262k tokens

Параметры

Релиз

03 апреля 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

Технический обзор

Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференсе активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели, при значительно меньших вычислительных затратах. Поддерживает мультимодальные входные данные, включая текст, изображения и видео (до 60 секунд с частотой 1 кадр в секунду). Оснащена 256K контекстным окном, встроенным вызовом функций, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Google Gemini модели Модели для программирования Недорогие модели Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Google: Gemma 4 26B A4B Текущая

Для чего

Контекст

262k

Цена ₽

8 / 38

Google: Gemma 4 26B A4B Текущая

262k

8 / 38

Модель

Google: Gemma 4 31B

Для чего

Старшая модель в линейке с аналогичными мультимодальными возможностями, но использующая более плотную архитектуру параметров.

Контекст

262k

Цена ₽

15 / 44

Google: Gemma 4 31B

262k

15 / 44

Модель

ByteDance Seed: Seed-2.0-Mini

Для чего

Прямой конкурент в сегменте компактных мультимодальных моделей, также поддерживающий обработку видео и длинных контекстов.

Контекст

262k

Цена ₽

13 / 50

ByteDance Seed: Seed-2.0-Mini

262k

13 / 50

Когда выбирать

Необходим анализ видеофайлов длительностью до одной минуты напрямую через API.
Требуется работа с большими объемами документов благодаря контекстному окну 256K.
Нужна высокая скорость генерации при сохранении качества ответов уровня 31B моделей.

Когда не выбирать

Требуется работа исключительно с текстовыми данными без мультимодальных функций.
Необходима максимальная точность в узкоспециализированных задачах, где эффективнее полноразмерные модели.
Задачи не подразумевают использование структурированного вывода или вызова функций.