Alltokens

Baidu: Qianfan-OCR-Fast (Бесплатно)

BABaiduОбновлено: 20 апреля 2026 г.

Qianfan-OCR-Fast — это специализированная мультимодальная модель от Baidu, оптимизированная для высокоскоростного распознавания текста. Она сочетает в себе глубокую экспертизу в OCR с возможностями интеллектуального анализа изображений, предлагая значительный прирост производительности по сравнению с базовыми версиями.

Использовать через API

Метрики

Вход

₽/M

Выход

₽/M

Контекст

66k tokens

Параметры

10

Релиз

20 апреля 2026 г.

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyseedstoptemperaturetop_p

Технический обзор

Qianfan-OCR-Fast is a domain-specific multimodal large model purpose-built for OCR. By leveraging specialized OCR training data while preserving versatile multimodal intelligence, it provides a powerful performance upgrade over Qianfan-OCR.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Для чего

Qianfan-OCR-Fast — это специализированная мультимодальная модель от Baidu, оптимизированная для высокоскоростного распознавания текста. Она сочетает в себе глубокую экспертизу в OCR с возможностями интеллектуального анализа изображений, предлагая значительный прирост производительности по сравнению с базовыми версиями.

Контекст

66k

Цена ₽

— / —

Модель

Для чего

Обе модели поддерживают мультимодальный ввод (текст и изображения) и ориентированы на эффективную обработку визуальных данных.

Контекст

1M

Цена ₽

— / —

Для чего

Являются компактными и быстрыми решениями для задач, требующих одновременного анализа текста и графического контента.

Контекст

131k

Цена ₽

14 / 14

Когда выбирать

  • Необходима высокая скорость извлечения текста из сложных документов и изображений
  • Требуется обработка больших объемов визуальных данных в рамках контекстного окна до 64k токенов
  • Нужна специализированная модель, обученная на специфических OCR-датасетах для повышения точности распознавания

Когда не выбирать

  • Требуется глубокое логическое рассуждение в чисто текстовых задачах без визуальной составляющей
  • Необходима генерация программного кода высокой сложности
  • Работа ведется исключительно с аудио- или видеофайлами без текстовых слоев

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru