Какова основная специализация модели GTE-Large?

Модель специализируется на создании высококачественных семантических эмбеддингов для поиска информации, оценки сходства текстов и переранжирования.

Какой максимальный объем текста может обработать модель за один раз?

Контекстное окно модели составляет 512 токенов, что подходит для предложений, абзацев и документов средней длины.

Можно ли использовать GTE-Large через alltokens для задач RAG?

Да, эта модель отлично подходит для построения систем Retrieval-Augmented Generation, обеспечивая точное сопоставление запросов пользователя с базой знаний.

Thenlper: GTE-Large

THThenlperОбновлено: 18 ноября 2025 г.

GTE-Large — это специализированная модель эмбеддингов, предназначенная для преобразования английского текста в плотные векторы размерностью 1024. Она оптимизирована для задач семантического поиска, ранжирования и анализа сходства текстов средней длины.

Использовать через API

Метрики

Вход

2 ₽/M

Выход

— ₽/M

Контекст

8k tokens

Параметры

Релиз

18 ноября 2025 г.

Поддерживаемые параметры

frequency_penaltymax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstoptemperaturetop_ktop_p

Технический обзор

Модель эмбеддингов gte-large преобразует английские предложения, абзацы и документы средней длины в 1024-мерное векторное пространство. Она обеспечивает высококачественные семантические эмбеддинги, оптимизированные для задач поиска информации, определения семантического сходства текстов, переранжирования и кластеризации. Модель обучена с использованием многоэтапного контрастивного обучения на обширном корпусе релевантных данных из различных областей, что гарантирует отличную производительность в универсальных сценариях использования эмбеддингов на alltokens.

Кодинг

Инструменты

Длинный контекст

Мультимодальность

Веб-автоматизация