Модель устарела
Из-за низкой популярности эта модель устарела и была удалена из API 8 мая 2026 г..
tencent/hy3-preview:freeHy3 preview is a high-efficiency Mixture-of-Experts model from Tencent designed for agentic workflows and production use. It supports configurable reasoning levels across disabled, low, and high modes, allowing it to...
Параметры, которые поддерживает эта модель в API-запросах
Система автоматически выбирает оптимального провайдера и переключается на резервный при сбоях.
Сравните разных провайдеров на AllTokens
Оценки модели из Artificial Analysis
Эта модель больше недоступна в API, поэтому использовать ее через AllTokens не получится. Быстрый старт для устаревшей модели скрыт, чтобы не вводить в заблуждение.
Tencent: Hy3 preview (Бесплатно) от провайдера tencent доступна через OpenAI-совместимый API AllTokens.
Страница агрегирует практические параметры для интеграции: стоимость входа и выхода, рабочий контекст, набор поддерживаемых параметров и сигналы для выбора модели под конкретные продакшн-сценарии.
Контекст
262 144 токенов
Цена входа
— / 1M токенов
Цена выхода
— / 1M токенов
Входные модальности
Выходные модальности
Добавлена в каталог
23.04.2026
Tencent: Hy3 preview
tencent
Hy3 preview — это высокоэффективная модель Mixture-of-Experts от Tencent, разработанная для агентных рабочих процессов и промышленного использования. Она поддерживает настраиваемые уровни рассуждений с режимами отключения, низким и высоким, что позволяет адаптировать работу модели под различные задачи.
Tencent: Hunyuan A13B Instruct
tencent
Hunyuan-A13B — это языковая модель на базе архитектуры смеси экспертов (MoE), разработанная компанией Tencent. Модель содержит 13 миллиардов активных параметров при общем объеме в 80 миллиардов параметров и поддерживает логический вывод через цепочку рассуждений (Chain-of-Thought). Она демонстрирует конкурентные результаты в тестах на знание математики, естественных наук, программирования и в задачах многоходового диалога. Высокая эффективность инференса обеспечивается использованием механизма Grouped Query Attention (GQA) и поддержкой различных методов квантования, включая FP8 и GPTQ. Модель доступна через API alltokens.
Подробный обзор модели
Новости, изменения цены, ключевые обновления и практические рекомендации по интеграции.
Открыть обзор
Модели для программирования
Выборка кодинг-моделей для разработки: инструменты, reasoning, качество генерации и скорость.
Смотреть подборку
Недорогие модели
Подборка доступных моделей ИИ с низкой стоимостью входных токенов и практичной производительностью.
Смотреть подборку
Модели с длинным контекстом
Список моделей с большим context window для анализа длинных документов, репозиториев и агентных пайплайнов.
Смотреть подборку