Какие типы данных может обрабатывать MiMo-V2-Omni?

Модель является нативно мультимодальной и поддерживает одновременную обработку текста, изображений, видео и аудио.

Поддерживает ли модель работу с кодом?

Да, MiMo-V2-Omni обладает агентскими способностями, включая написание и исполнение кода, а также многошаговое планирование.

Каков максимальный объем контекста у этой модели?

Модель поддерживает внушительное контекстное окно размером 262 144 токена, что позволяет работать с очень длинными входными данными.

Xiaomi: MiMo-V2-Omni

XIXiaomiОбновлено: 18 марта 2026 г.

MiMo-V2-Omni от Xiaomi — это передовая мультимодальная модель, способная нативно обрабатывать изображения, видео и аудио в единой архитектуре. Благодаря контекстному окну в 256K и продвинутым агентским навыкам, она эффективно справляется с многошаговым планированием и исполнением кода.

Использовать через API

Метрики

Вход

48 ₽/M

Выход

240 ₽/M

Контекст

262k tokens

Параметры

Релиз

18 марта 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningresponse_formatstoptemperaturetool_choicetoolstop_p

Технический обзор

MiMo-V2-Omni - это передовая омни-модель, которая нативно обрабатывает изображения, видео и аудио в единой архитектуре. Она сочетает в себе мощное мультимодальное восприятие с агентными возможностями - визуальную привязку, многошаговое планирование, использование инструментов и выполнение кода, что делает ее идеальной для сложных реальных задач, охватывающих различные модальности. Контекстное окно 256K.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация

Смежные подборки

Модели для программирования Недорогие модели Модели с длинным контекстом

Сравнение с похожими моделями

Модель

Для чего

Контекст

Цена ₽

Модель

Xiaomi: MiMo-V2-OmniТекущая

Для чего

Контекст

262k

Цена ₽

48 / 240

Xiaomi: MiMo-V2-OmniТекущая

262k

48 / 240

Модель

Healer Alpha

Для чего

Обе модели поддерживают одинаковый набор входных модальностей, включая видео и аудио, что делает их прямыми конкурентами в мультимодальном анализе.

Контекст

262k

Цена ₽

— / —

Healer Alpha

262k

— / —

Модель

MoonshotAI: Kimi K2 0905

Для чего

Модели имеют идентичную стоимость токенов и ориентированы на решение сложных задач, требующих глубокого понимания контекста.

Контекст

262k

Цена ₽

72 / 299

MoonshotAI: Kimi K2 0905

262k

72 / 299

Когда выбирать

Необходим комплексный анализ видео или аудио материалов в рамках одного запроса
Требуется выполнение кода или использование внешних инструментов для решения задач
Работа с объемными документами или длинными медиафайлами благодаря контексту 256K

Когда не выбирать

Задачи ограничены только текстовым взаимодействием без необходимости мультимодальности
Требуется генерация изображений или видео, так как модель работает только на текстовый вывод
Бюджет ограничен, и не требуются специфические агентские функции планирования