Google: Gemini 2.5 Flash Lite

Рассуждения

google/gemini-2.5-flash-lite

1 048 576 контекст

Вход: 7 ₽/1MВыход: 25 ₽/1MВходное изображение: 0,000006 ₽Аудио: 0,000019 ₽Рассуждения: 25 ₽/1M

Вход

ТекстИзображенияФайлыАудиоВидео

Выход

Текст

Gemini 2.5 Flash-Lite — это облегченная модель в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, ускоренную генерацию токенов и лучшие показатели в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция рассуждений отключена для обеспечения максимальной скорости работы, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повысить интеллектуальные возможности модели за счет увеличения стоимости. На платформе alltokens вы можете интегрировать данную модель в свои проекты.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

include_reasoningmax_tokensreasoningresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Активность

Доступность

Провайдеры для Google: Gemini 2.5 Flash Lite

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-2.5-flash-lite",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

Google: Gemini 2.5 Flash Lite от провайдера google доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

1 048 576 токенов

Цена входа

7 ₽ / 1M токенов

Цена выхода

25 ₽ / 1M токенов

Входные модальности

ТекстИзображенияФайлыАудиоВидео

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Мультимодальные кейсы: обработка комбинаций текста и медиа во входящих запросах.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Google Gemini модели

Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.

Смотреть подборку

Модели для программирования

Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.

Смотреть подборку

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Модели с длинным контекстом

Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.

Смотреть подборку