Google: Gemini 2.5 Flash Lite Preview 09-2025

Рассуждения

google/gemini-2.5-flash-lite-preview-09-2025

1 048 576 контекст

Вход: 13 ₽/1MВыход: 50 ₽/1MВходное изображение: 0,000012 ₽Аудио: 0,000037 ₽Рассуждения: 50 ₽/1M

Вход

ТекстИзображенияФайлыАудиоВидео

Выход

Текст

Gemini 2.5 Flash-Lite — это облегченная модель рассуждений в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и максимальной экономической эффективности. Она обеспечивает повышенную пропускную способность, более генерацию токенов и улучшенную производительность в стандартных тестах по сравнению с предыдущими моделями Flash. По умолчанию функция мышления (многопроходное рассуждение) отключена для обеспечения максимальной скорости, однако разработчики могут активировать ее через параметр Reasoning API, чтобы выборочно повышать уровень интеллекта модели за счет увеличения стоимости. На alltokens вы можете получить доступ к этой модели для интеграции в свои проекты.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

include_reasoningmax_tokensreasoningresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Активность

Доступность

Провайдеры для Google: Gemini 2.5 Flash Lite Preview 09-2025

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-2.5-flash-lite-preview-09-2025",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

Google: Gemini 2.5 Flash Lite Preview 09-2025 от провайдера google доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

1 048 576 токенов

Цена входа

13 ₽ / 1M токенов

Цена выхода

50 ₽ / 1M токенов

Входные модальности

ТекстИзображенияФайлыАудио

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Мультимодальные кейсы: обработка комбинаций текста и медиа во входящих запросах.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Google Gemini модели

Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.

Смотреть подборку

Модели для программирования

Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.

Смотреть подборку

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

Google: Gemini 2.5 Flash Lite Preview 09-2025

Поддерживаемые параметры

Активность

Доступность

Провайдеры для Google: Gemini 2.5 Flash Lite Preview 09-2025

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости