google/gemini-3-flash-previewGemini 3 Flash Preview — это высокоскоростная и эффективная модель с поддержкой логических рассуждений, разработанная для агентных рабочих процессов, многошаговых диалогов и помощи в написании кода. Она обеспечивает производительность в рассуждениях и использовании инструментов на уровне, близком к версии Pro, но с существенно меньшей задержкой, чем у более крупных вариантов Gemini. Это делает ее оптимальным выбором для интерактивной разработки, длительных циклов работы агентов и совместного программирования. По сравнению с Gemini 2.5 Flash, данная модель предлагает значительные улучшения в качестве логических выводов, мультимодальном понимании и надежности.
Модель поддерживает контекстное окно объемом 1 миллион токенов и мультимодальные входные данные, включая текст, изображения, аудио, видео и PDF-файлы, с выводом в текстовом формате. Функционал включает настраиваемые уровни рассуждений (минимальный, низкий, средний, высокий), структурированный вывод, использование инструментов и автоматическое кэширование контекста. Gemini 3 Flash Preview оптимизирована для пользователей, которым требуются развитые способности к рассуждению и агентное поведение без затрат и задержек, характерных для полномасштабных флагманских моделей.
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
curl https://api.alltokens.ru/api/v1/chat/completions \
-H "Authorization: Bearer $ALLTOKENS_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemini-3-flash-preview",
"messages": [
{"role": "user", "content": "Привет! Кратко объясни, что умеешь."}
]
}'Google: Gemini 3 Flash Preview от провайдера google доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
1 048 576 токенов
Цена входа
60 ₽ / 1M токенов
Цена выхода
359 ₽ / 1M токенов
Входные модальности
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для задач с низкой задержкой и высокой нагрузкой. Модель поддерживает ввод текста, изображений, видео, аудио и PDF, и предназначена для использования в легких агентских приложениях.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель векторных представлений от Google, которая отображает текст, изображения, видео, аудио и PDF-файлы в единое векторное пространство для семантического поиска и генерации с расширением через поиск (RAG).
Google: Gemma 4 26B A4B (Бесплатно)
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Google Gemini модели
Подборка Google Gemini моделей: мультимодальность, контекст и сравнение стоимости.
Смотреть подборку
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку
Выходные модальности
Добавлена в каталог
06.02.2026
Gemma 4 26B A4B IT — это модель с инструкционной настройкой Mixture-of-Experts (MoE) от Google DeepMind. Несмотря на 25,2 млрд общих параметров, при инференции активируется только 3,8 млрд на токен — обеспечивая качество, близкое к 31-миллиардной модели.
Мультимодальные модели
Список мультимодальных LLM-моделей с поддержкой нескольких типов входа для сложных AI-сценариев.
Смотреть подборку