Какие типы данных может обрабатывать Step 3.7 Flash?

Модель является нативно мультимодальной, что позволяет ей одновременно работать с текстом, статичными изображениями и видеофайлами.

Каков объем контекстного окна данной модели?

Step 3.7 Flash поддерживает до 256 000 токенов, что позволяет загружать в один запрос целые книги или длительные видеозаписи.

Можно ли использовать модель через alltokens?

Да, модель Step 3.7 Flash доступна для интеграции и использования через платформу alltokens с поддержкой всех заявленных функций.

StepFun: Step 3.7 Flash

STStepfunОбновлено: 28 мая 2026 г.

Step 3.7 Flash — это высокоэффективная мультимодальная модель на базе архитектуры Mixture-of-Experts, предназначенная для быстрой обработки текста, изображений и видео. Благодаря контекстному окну в 256 000 токенов и нативному визуальному кодировщику, она обеспечивает глубокое понимание сложного контента при минимальных задержках.

Использовать через API

Метрики

Вход

25 ₽/M

Выход

143 ₽/M

Контекст

256k tokens

Параметры

Релиз

28 мая 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_ppresence_penaltyreasoningreasoning_effortrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

Технический обзор

Шаг 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу с 196 миллиардами параметров и визуальный энкодер для нативного понимания изображений и видео, активируя примерно 11 миллиардов параметров.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

StepFun: Step 3.7 FlashТекущая

Для чего

Контекст

256k

Цена ₽

25 / 143

StepFun: Step 3.7 FlashТекущая

256k

25 / 143

Модель

Qwen: Qwen3.6 Flash

Для чего

Обе модели относятся к категории Flash-решений с поддержкой мультимодальности и ориентированы на высокую скорость генерации.

Контекст

Цена ₽

24 / 140

Qwen: Qwen3.6 Flash

24 / 140

Модель

Z.ai: GLM 4.6V

Для чего

Является прямым конкурентом в области понимания видео и изображений, используя схожие подходы к обработке визуальных данных.

Контекст

131k

Цена ₽

38 / 112

Z.ai: GLM 4.6V

131k

38 / 112

Когда выбирать

Необходим анализ длинных видеороликов или больших массивов изображений в реальном времени
Требуется работа с объемными документами благодаря контекстному окну 256k
Нужна высокая скорость отклика в мультимодальных сценариях использования

Когда не выбирать

Требуется работа исключительно с текстовыми данными без необходимости визуального анализа
Необходима модель с максимальным количеством активных параметров для сверхсложных логических задач
Используются специфические инструменты, не поддерживаемые текущим набором параметров модели