Alltokens

Mistral: Voxtral Small 24B 2507

MIMistralaiОбновлено: 30 октября 2025 г.

Voxtral Small 24B — это продвинутая мультимодальная модель, объединяющая текстовые возможности Mistral Small 3 с функциями обработки аудио. Она демонстрирует высокую точность в транскрибации, переводе и глубоком понимании аудиоконтента при сохранении отличных показателей в текстовых задачах.

Использовать через API

Метрики

Вход

13 ₽/M

Выход

38 ₽/M

Контекст

32k tokens

Параметры

11

Релиз

30 октября 2025 г.

Поддерживаемые параметры

frequency_penaltymax_tokenspresence_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_p

Технический обзор

Voxtral Small представляет собой усовершенствованную версию Mistral Small 3, которая объединяет передовые возможности обработки аудио с сохранением лучших в своем классе показателей работы с текстом. Модель демонстрирует выдающиеся результаты в транскрибации речи, переводе и понимании аудиоконтента. Стоимость обработки входящего аудио на alltokens составляет 100 долларов за миллион секунд.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

Voxtral Small 24B — это продвинутая мультимодальная модель, объединяющая текстовые возможности Mistral Small 3 с функциями обработки аудио. Она демонстрирует высокую точность в транскрибации, переводе и глубоком понимании аудиоконтента при сохранении отличных показателей в текстовых задачах.

Контекст

32k

Цена ₽

13 / 38

Для чего

Обе модели базируются на архитектуре Mistral Small, но Voxtral добавляет поддержку аудиовхода.

Контекст

33k

Цена ₽

13 / 38

Для чего

Являются конкурентами в сегменте компактных и быстрых моделей с сопоставимой производительностью на текстовых задачах.

Контекст

262k

Цена ₽

12 / 38

Когда выбирать

  • Необходима качественная транскрибация и перевод аудио в текст
  • Требуется анализ аудиоконтента с сохранением высокой точности текстовых ответов
  • Нужна эффективная модель среднего размера для интеграции в мультимодальные рабочие процессы через alltokens

Когда не выбирать

  • Требуется работа с очень длинными контекстами, превышающими 32 000 токенов
  • Необходима генерация аудиофайлов (модель работает только на вход аудио)
  • Задача требует использования сверхкрупных моделей для сложнейших логических вычислений

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru