Google: Gemma 3n 4B

google/gemma-3n-e4b-it

32 768 контекст

Вход: 8 ₽/1MВыход: 15 ₽/1M

Вход

Текст

Выход

Текст

Gemma 3n E4B-it оптимизирована для эффективной работы на мобильных и маломощных устройствах, таких как смартфоны, ноутбуки и планшеты. Модель поддерживает мультимодальные входные данные, включая текст, изображения и аудио, что позволяет выполнять широкий спектр задач: генерацию текста, распознавание речи, перевод и анализ изображений. Благодаря внедрению таких инноваций, как кэширование эмбеддингов на каждом слое (PLE) и архитектура MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузкой, выборочно активируя параметры модели, что значительно снижает требования к ресурсам во время работы.

Модель поддерживает более 140 языков и обладает гибким контекстным окном в 32 000 токенов. Gemma 3n способна выборочно загружать параметры, оптимизируя потребление памяти и вычислительную эффективность в зависимости от конкретной задачи или возможностей устройства. Это делает ее отличным решением для приложений, ориентированных на конфиденциальность, работу в автономном режиме и локальное использование ИИ на устройствах через alltokens.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatstopstructured_outputstemperaturetop_ktop_p

Активность

Доступность

Провайдеры для Google: Gemma 3n 4B

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemma-3n-e4b-it",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

Google: Gemma 3n 4B от провайдера google доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

32 768 токенов

Цена входа

8 ₽ / 1M токенов

Цена выхода

15 ₽ / 1M токенов

Входные модальности

Текст

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Продуктовые сценарии со средними и длинными диалогами без агрессивной обрезки контекста.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Быстрый запуск через OpenAI-совместимый API без отдельной адаптации клиента под провайдера.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Google Gemini модели

Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.

Смотреть подборку

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку