google/gemini-2.5-flash-liteGemini 2.5 Flash-Lite — это облегченная модель в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, ускоренную генерацию токенов и лучшие показатели в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция рассуждений отключена для обеспечения максимальной скорости работы, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повысить интеллектуальные возможности модели за счет увеличения стоимости. На платформе alltokens вы можете интегрировать данную модель в свои проекты.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemini-2.5-flash-lite",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Google: Gemini 2.5 Flash Lite от провайдера google доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
1 048 576 токенов
Цена входа
13 ₽ / 1M токенов
Цена выхода
50 ₽ / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
06.02.2026
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель векторных представлений от Google, которая отображает текст, изображения, видео, аудио и PDF-файлы в единое векторное пространство для семантического поиска и генерации с расширением через поиск (RAG).
Google: Gemma 4 26B A4B (Бесплатно)
Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференции активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели.
Google: Gemma 4 26B A4B
Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференсе активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели, при значительно меньших вычислительных затратах. Поддерживает мультимодальные входные данные, включая текст, изображения и видео (до 60 секунд с частотой 1 кадр в секунду). Оснащена 256K контекстным окном, встроенным вызовом функций, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.
Google: Gemma 4 31B (Бесплатно)
Gemma 4 31B Instruct - это мультимодальная плотная модель Google DeepMind объемом 30,7 миллиарда параметров, поддерживающая текстовые и изображений входные данные с текстовым выводом. Оснащена 256K контекстным окном, настраиваемым режимом мышления/рассуждения, встроенными функциями...
Google: Gemma 4 31B
Gemma 4 31B Instruct — это мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая текстовые и изображений входные данные с текстовым выводом. Оснащена 256K контекстным окном, настраиваемым режимом мышления/рассуждения, встроенным вызовом функций и многоязычной поддержкой более 140 языков. Отлично справляется с программированием, рассуждениями и пониманием документов. Распространяется под лицензией Apache 2.0.
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Google Gemini модели
Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.
Смотреть подборку
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку