Alltokens

StepFun: Step 3.7 Flash

STStepfunОбновлено: 28 мая 2026 г.

Step 3.7 Flash — это высокоэффективная мультимодальная модель на базе архитектуры Mixture-of-Experts, предназначенная для быстрой обработки текста, изображений и видео. Благодаря контекстному окну в 256 000 токенов и нативному визуальному кодировщику, она обеспечивает глубокое понимание сложного контента при минимальных задержках.

Использовать через API

Метрики

Вход

25 ₽/M

Выход

143 ₽/M

Контекст

256k tokens

Параметры

12

Релиз

28 мая 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogprobsmax_tokensreasoningresponse_formatstopstructured_outputstemperaturetoolstop_logprobstop_p

Технический обзор

Шаг 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу с 196 миллиардами параметров и визуальный энкодер для нативного понимания изображений и видео, активируя примерно 11 миллиардов параметров.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Step 3.7 Flash — это высокоэффективная мультимодальная модель на базе архитектуры Mixture-of-Experts, предназначенная для быстрой обработки текста, изображений и видео. Благодаря контекстному окну в 256 000 токенов и нативному визуальному кодировщику, она обеспечивает глубокое понимание сложного контента при минимальных задержках.

Контекст

256k

Цена ₽

25 / 143

Для чего

Обе модели относятся к категории Flash-решений с поддержкой мультимодальности и ориентированы на высокую скорость генерации.

Контекст

1M

Цена ₽

24 / 140

Модель

Для чего

Является прямым конкурентом в области понимания видео и изображений, используя схожие подходы к обработке визуальных данных.

Контекст

131k

Цена ₽

38 / 112

Когда выбирать

  • Необходим анализ длинных видеороликов или больших массивов изображений в реальном времени
  • Требуется работа с объемными документами благодаря контекстному окну 256k
  • Нужна высокая скорость отклика в мультимодальных сценариях использования

Когда не выбирать

  • Требуется работа исключительно с текстовыми данными без необходимости визуального анализа
  • Необходима модель с максимальным количеством активных параметров для сверхсложных логических задач
  • Используются специфические инструменты, не поддерживаемые текущим набором параметров модели

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru