Alltokens

Google: Gemini 3.1 Flash Lite

GoogleGoogleОбновлено: 07 мая 2026 г.

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.

Использовать через API

Метрики

Вход

32 ₽/M

Выход

187 ₽/M

Контекст

1M tokens

Параметры

11

Релиз

07 мая 2026 г.

Поддерживаемые параметры

include_reasoningmax_tokensreasoningresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель от Google, оптимизированная для задач с минимальной задержкой и большими объемами данных. Она поддерживает работу с текстом, изображениями, видео, аудио и PDF, предлагая контекстное окно в 1 миллион токенов для сложных агентских сценариев.

Контекст

1M

Цена ₽

32 / 187

Для чего

Является прямой предрелизной версией той же архитектуры с идентичными возможностями обработки мультимодальных данных.

Контекст

1M

Цена ₽

32 / 187

Для чего

Относится к семейству Flash, но предлагает иной баланс между производительностью и скоростью генерации в рамках экосистемы Google.

Контекст

1M

Цена ₽

36 / 299

Когда выбирать

  • Необходима обработка сверхдлинных документов или медиафайлов объемом до 1 миллиона токенов
  • Требуется минимальная задержка ответа в высоконагруженных агентских системах
  • Нужна нативная поддержка мультимодальных входных данных, включая видео и аудио

Когда не выбирать

  • Требуется максимальная глубина рассуждений, характерная для моделей класса Pro или Ultra
  • Задачи не связаны с мультимодальностью и не требуют большого контекстного окна
  • Необходима работа в полностью офлайн-режиме без использования облачной инфраструктуры

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru