Alltokens

OpenAI: GPT Audio Mini

OpenaiOpenaiОбновлено: 19 января 2026 г.

GPT Audio Mini — это оптимизированная версия мультимодальной модели от OpenAI, предназначенная для эффективной обработки аудио и текста. Обновленный декодер обеспечивает естественное звучание голоса и высокую стабильность вокальных характеристик при сохранении внушительного контекстного окна.

Использовать через API

Метрики

Вход

72 ₽/M

Выход

288 ₽/M

Контекст

128k tokens

Параметры

14

Релиз

19 января 2026 г.

Поддерживаемые параметры

frequency_penaltylogit_biaslogprobsmax_tokenspresence_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_logprobstop_p

Технический обзор

Экономичная версия GPT Audio. Новое обновление включает улучшенный декодер для более естественного звучания голосов и обеспечивает более стабильную передачу тембра. Стоимость входных данных составляет 0,60 доллара за миллион токенов, а выходных — 2,40 доллара за миллион токенов.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Для чего

GPT Audio Mini — это оптимизированная версия мультимодальной модели от OpenAI, предназначенная для эффективной обработки аудио и текста. Обновленный декодер обеспечивает естественное звучание голоса и высокую стабильность вокальных характеристик при сохранении внушительного контекстного окна.

Контекст

128k

Цена ₽

72 / 288

Модель

Для чего

Старшая версия в линейке с аналогичной мультимодальностью, предлагающая эталонное качество при более высоких требованиях к ресурсам.

Контекст

128k

Цена ₽

288 / 1 150

Для чего

Предшествующая флагманская модель с поддержкой аудио, на базе которой строились стандарты взаимодействия с голосовым вводом.

Контекст

128k

Цена ₽

288 / 1 150

Когда выбирать

  • Необходима высокая скорость генерации голосовых ответов с естественными интонациями
  • Требуется обработка длинных аудиозаписей в рамках контекста до 128k токенов
  • Нужна стабильная работа со структурированными данными (Structured Outputs) в аудио-формате

Когда не выбирать

  • Требуется максимально возможное качество рассуждений, доступное только во флагманских моделях без приставки Mini
  • Работа ведется исключительно с текстовыми данными без необходимости использования аудио-модальности
  • Необходима поддержка специфических узкоспециализированных языковых диалектов, не входящих в основной набор обучения

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru