Модель скоро станет недоступна

Эта модель будет удалена из API 1 июня 2026 г..

Google: Gemini 2.0 Flash Lite

РассужденияУдаляется 1 июня 2026 г.

google/gemini-2.0-flash-lite-001

1 048 576 контекст

Вход: 10 ₽/1MВыход: 38 ₽/1MВходное изображение: 0,000009 ₽Аудио: 0,000009 ₽Рассуждения: 38 ₽/1M

Вход

ТекстИзображенияФайлыАудиоВидео

Выход

Текст

Gemini 2.0 Flash Lite обеспечивает значительно более высокую скорость генерации первого токена (TTFT) по сравнению с Gemini Flash 1.5. При этом модель сохраняет качество работы на уровне более крупных решений, таких как Gemini Pro 1.5, предлагая максимально экономичную стоимость токенов.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

max_tokensresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Активность

Доступность

Провайдеры для Google: Gemini 2.0 Flash Lite

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-2.0-flash-lite-001",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

Google: Gemini 2.0 Flash Lite от провайдера google доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

1 048 576 токенов

Цена входа

10 ₽ / 1M токенов

Цена выхода

38 ₽ / 1M токенов

Входные модальности

ТекстИзображенияФайлыАудиоВидео

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Мультимодальные кейсы: обработка комбинаций текста и медиа во входящих запросах.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Google Gemini модели

Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.

Смотреть подборку

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Модели с длинным контекстом

Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.

Смотреть подборку

Продукт

Платформа

Контент

Разработчикам

Право

Контакты

Google: Gemini 2.0 Flash Lite

Поддерживаемые параметры

Активность

Доступность

Провайдеры для Google: Gemini 2.0 Flash Lite

Производительность

Бенчмарки

Быстрый старт

Технический профиль модели

Когда выбирать эту модель

Что проверить перед запуском

Похожие модели

Сравнение и новости