google/gemma-3-4b-itGemma 3 внедряет мультимодальность, поддерживая визуально-языковой ввод и текстовый вывод. Модель обрабатывает контекстное окно объемом до 128 000 токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, логических рассуждений и ведения диалога, включая поддержку структурированных ответов и вызов функций.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemma-3-4b-it",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Google: Gemma 3 4B от провайдера google доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
131 072 токенов
Цена входа
6 ₽ / 1M токенов
Цена выхода
11 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
Google: Gemma 4 26B A4B
Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференсе активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели, при значительно меньших вычислительных затратах. Поддерживает мультимодальные входные данные, включая текст, изображения и видео (до 60 секунд с частотой 1 кадр в секунду). Оснащена 256K контекстным окном, встроенным вызовом функций, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.
Google: Gemma 4 31B
Gemma 4 31B Instruct — это мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая текстовые и изображений входные данные с текстовым выводом. Оснащена 256K контекстным окном, настраиваемым режимом мышления/рассуждения, встроенным вызовом функций и многоязычной поддержкой более 140 языков. Отлично справляется с программированием, рассуждениями и пониманием документов. Распространяется под лицензией Apache 2.0.
Google: Lyria 3 Pro Preview
Lyria 3 — это семейство моделей генерации музыки от Google, доступное через API Gemini. С помощью Lyria 3 вы можете создавать высококачественное стереозвуковое аудио с частотой 48 кГц на основе текстовых подсказок или изображений. Эти модели обеспечивают структурную целостность, включая вокал, синхронизированные тексты и полные инструментальные аранжировки. Lyria 3 Pro способна генерировать полноформатные песни с припевами, куплетами и переходными частями.
Google: Lyria 3 Clip Preview
Lyria 3 — это семейство моделей генерации музыки от Google, доступное через Gemini API. С помощью Lyria 3 вы можете создавать высококачественное стереозвуковое аудио с частотой 48 кГц на основе текстовых описаний или изображений. Эти модели обеспечивают структурную целостность, включая вокал, синхронизированные тексты и полные инструментальные аранжировки. Lyria 3 Clip позволяет генерировать короткие клипы, петли и превью.
Google: Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для задач с высоким объемом использования. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым возможностям. Улучшения охватывают аудиовход/ASR, ранжирование фрагментов RAG, перевод, извлечение данных и завершение кода. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки компромисса между стоимостью и производительностью. Стоит в два раза дешевле Gemini 3 Flash.
Google: Nano Banana 2 (Gemini 3.1 Flash Image Preview)
Gemini 3.1 Flash Image Preview, также известная как Nano Banana 2, — это новейшая современная модель Google для генерации и редактирования изображений, обеспечивающая визуальное качество уровня Pro на скорости Flash. Она сочетает в себе глубокое понимание контекста с быстрым и экономичным выводом, что делает создание сложных визуальных эффектов и итеративное редактирование значительно доступнее. Соотношение сторон можно настраивать с помощью параметра API image_config. Модель доступна на платформе alltokens.
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Google Gemini модели
Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Мультимодальные модели
Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.
Смотреть подборку