В чем главное преимущество GPT Audio Mini перед стандартными моделями?

Главное преимущество заключается в нативной поддержке аудио-входа и аудио-выхода, что позволяет модели понимать интонации и отвечать естественным голосом через сервис alltokens.

Каков объем контекстного окна у данной модели?

Модель поддерживает до 128 000 токенов, что позволяет анализировать длительные звуковые файлы или большие объемы текстовой информации за один запрос.

Поддерживает ли модель работу с инструментами и функциями?

Да, GPT Audio Mini поддерживает широкий спектр параметров, включая вызов инструментов (tools), структурированный вывод и настройку температуры ответов.

OpenAI: GPT Audio Mini

OpenaiОбновлено: 19 января 2026 г.

GPT Audio Mini — это оптимизированная версия мультимодальной модели от OpenAI, предназначенная для эффективной обработки аудио и текста. Обновленный декодер обеспечивает естественное звучание голоса и высокую стабильность вокальных характеристик при сохранении внушительного контекстного окна.

Использовать через API

Метрики

Вход

72 ₽/M

Выход

288 ₽/M

Контекст

128k tokens

Параметры

Релиз

19 января 2026 г.

Поддерживаемые параметры

frequency_penaltylogit_biaslogprobsmax_tokenspresence_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_logprobstop_p

Технический обзор

Экономичная версия GPT Audio. Новое обновление включает улучшенный декодер для более естественного звучания голосов и обеспечивает более стабильную передачу тембра. Стоимость входных данных составляет 0,60 доллара за миллион токенов, а выходных — 2,40 доллара за миллион токенов.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

OpenAI модели Модели для программирования

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

OpenAI: GPT Audio MiniТекущая

Для чего

Контекст

128k

Цена ₽

72 / 288

OpenAI: GPT Audio MiniТекущая

128k

72 / 288

Модель

OpenAI: GPT Audio

Для чего

Старшая версия в линейке с аналогичной мультимодальностью, предлагающая эталонное качество при более высоких требованиях к ресурсам.

Контекст

128k

Цена ₽

288 / 1 150

OpenAI: GPT Audio

128k

288 / 1 150

Модель

openai/gpt-4o-audio-preview

Для чего

Предшествующая флагманская модель с поддержкой аудио, на базе которой строились стандарты взаимодействия с голосовым вводом.

Контекст

—

Цена ₽

— / —

openai/gpt-4o-audio-preview

—

— / —

Когда выбирать

Необходима высокая скорость генерации голосовых ответов с естественными интонациями
Требуется обработка длинных аудиозаписей в рамках контекста до 128k токенов
Нужна стабильная работа со структурированными данными (Structured Outputs) в аудио-формате

Когда не выбирать

Требуется максимально возможное качество рассуждений, доступное только во флагманских моделях без приставки Mini
Работа ведется исключительно с текстовыми данными без необходимости использования аудио-модальности
Необходима поддержка специфических узкоспециализированных языковых диалектов, не входящих в основной набор обучения