Модель устарела
Из-за низкой популярности эта модель устарела и была удалена из API 5 мая 2026 г..
google/gemma-3n-e4b-it:freeGemma 3n E4B-it оптимизирована для эффективной работы на мобильных и маломощных устройствах, таких как смартфоны, ноутбуки и планшеты. Модель поддерживает мультимодальные входные данные, включая текст, визуальную информацию и аудио, что позволяет выполнять широкий спектр задач: генерацию текста, распознавание речи, перевод и анализ изображений. Благодаря внедрению таких инноваций, как кэширование эмбеддингов на каждом слое (PLE) и архитектура MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузкой, выборочно активируя параметры модели, что значительно снижает требования к ресурсам во время работы.
Модель поддерживает более 140 языков и обладает гибким контекстным окном в 32K токенов. Gemma 3n способна выборочно загружать параметры, оптимизируя потребление памяти и вычислительную эффективность в зависимости от конкретной задачи или возможностей устройства. Это делает ее отличным решением для приложений, ориентированных на конфиденциальность, работу в автономном режиме и локальное использование ИИ на устройствах через alltokens.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
Эта модель больше недоступна в API, поэтому использовать ее через AllTokens не получится. Быстрый старт для устаревшей модели скрыт, чтобы не вводить в заблуждение.
Google: Gemma 3n 4B (Бесплатно) от провайдера google доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
8 192 токенов
Цена входа
— / 1M токенов
Цена выхода
— / 1M токенов
Входные модальности
Выходные модальности
Google: Gemini 3.5 Flash
Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution...
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель векторных представлений от Google, которая отображает текст, изображения, видео, аудио и PDF-файлы в единое векторное пространство для семантического поиска и генерации с расширением через поиск (RAG).
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Google Gemini модели
Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Добавлена в каталог
06.02.2026