Google: Gemini 3 Flash Preview

Рассуждения

google/gemini-3-flash-preview

1 048 576 контекст

Вход: 32 ₽/1MВыход: 187 ₽/1MВходное изображение: 0,000031 ₽Аудио: 0,000062 ₽Рассуждения: 187 ₽/1M

Вход

ТекстИзображенияФайлыАудиоВидео

Выход

Текст

Gemini 3 Flash Preview — это высокоскоростная и эффективная модель с поддержкой логических рассуждений, разработанная для агентных рабочих процессов, многошаговых диалогов и помощи в написании кода. Она обеспечивает производительность в рассуждениях и использовании инструментов на уровне, близком к версии Pro, но с существенно меньшей задержкой, чем у более крупных вариантов Gemini. Это делает ее оптимальным выбором для интерактивной разработки, длительных циклов работы агентов и совместного программирования. По сравнению с Gemini 2.5 Flash, данная модель предлагает значительные улучшения в качестве логических выводов, мультимодальном понимании и надежности.

Модель поддерживает контекстное окно объемом 1 миллион токенов и мультимодальные входные данные, включая текст, изображения, аудио, видео и PDF-файлы, с выводом в текстовом формате. Функционал включает настраиваемые уровни рассуждений (минимальный, низкий, средний, высокий), структурированный вывод, использование инструментов и автоматическое кэширование контекста. Gemini 3 Flash Preview оптимизирована для пользователей, которым требуются развитые способности к рассуждению и агентное поведение без затрат и задержек, характерных для полномасштабных флагманских моделей.

Поддерживаемые параметры

Параметры, которые поддерживает эта модель в API-запросах

include_reasoningmax_tokensreasoningreasoning_effortresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Активность

Доступность

Провайдеры для Google: Gemini 3 Flash Preview

Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.

Сортировка:

Производительность

Сравните разных провайдеров на AllTokens

Бенчмарки

Оценки модели из Artificial Analysis

Быстрый старт

https://api.alltokens.ru/api/v1Полная документация →

bash

curl https://api.alltokens.ru/api/v1/chat/completions \
  -H "Authorization: Bearer $ALLTOKENS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-3-flash-preview",
    "messages": [
      {"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
    ]
  }'

Технический профиль модели

Google: Gemini 3 Flash Preview от провайдера google доступна через OpenAI-совместимый API AllTokens.

Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.

Контекст

1 048 576 токенов

Цена входа

32 ₽ / 1M токенов

Цена выхода

187 ₽ / 1M токенов

Входные модальности

ТекстИзображенияФайлыАудиоВидео

Выходные модальности

Текст

Добавлена в каталог

06.02.2026

Когда выбирать эту модель

Работа с длинными документами: регламенты, отчеты, knowledge base и большие диалоги.
Агентные сценарии с tool calling: вызовы функций, оркестрация шагов и интеграция с внутренними API.
Задачи, где нужен структурированный JSON-ответ и строгая схема результата.
Мультимодальные кейсы: обработка комбинаций текста и медиа во входящих запросах.

Что проверить перед запуском

Перед продом проверьте реальные лимиты по токенам и поведение модели на ваших длинных запросах.
Сделайте бюджетные алерты и лимиты расходов: итоговая стоимость зависит от длины ответов и ретраев.
Проверьте совместимость всех используемых параметров запроса в staging перед релизом.
Проведите A/B тест на вашем датасете: сравните качество, latency и стоимость с 1-2 альтернативами.

Сравнение и новости

Подробный обзор модели

Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.

Открыть обзор

Google Gemini модели

Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.

Смотреть подборку

Модели для программирования

Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.

Смотреть подборку

Недорогие модели

Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.

Смотреть подборку

Модели с длинным контекстом

Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.

Смотреть подборку