Alltokens

Thenlper: GTE-Large

THThenlperОбновлено: 18 ноября 2025 г.

GTE-Large — это специализированная модель эмбеддингов, предназначенная для преобразования английского текста в плотные векторы размерностью 1024. Она оптимизирована для задач семантического поиска, ранжирования и анализа сходства текстов средней длины.

Использовать через API

Метрики

Вход

2 ₽/M

Выход

0 ₽/M

Контекст

8k tokens

Параметры

11

Релиз

18 ноября 2025 г.

Поддерживаемые параметры

frequency_penaltymax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstoptemperaturetop_ktop_p

Технический обзор

Модель эмбеддингов gte-large преобразует английские предложения, абзацы и документы средней длины в 1024-мерное векторное пространство. Она обеспечивает высококачественные семантические эмбеддинги, оптимизированные для задач поиска информации, определения семантического сходства текстов, переранжирования и кластеризации. Модель обучена с использованием многоэтапного контрастивного обучения на обширном корпусе релевантных данных из различных областей, что гарантирует отличную производительность в универсальных сценариях использования эмбеддингов на alltokens.

Кодинг
Инструменты
Длинный контекст
Мультимодальность
Веб-автоматизация

Смежные подборки

Сравнение с похожими моделями

Модель

Thenlper: GTE-LargeТекущая

Для чего

GTE-Large — это специализированная модель эмбеддингов, предназначенная для преобразования английского текста в плотные векторы размерностью 1024. Она оптимизирована для задач семантического поиска, ранжирования и анализа сходства текстов средней длины.

Контекст

8k

Цена ₽

2 / 0

Для чего

Обе модели предназначены для создания текстовых эмбеддингов и используются в схожих сценариях информационного поиска.

Контекст

32k

Цена ₽

4 / 0

Для чего

Модели представляют собой решения для векторизации текста, где GTE-Large предлагает высокую точность при умеренном контекстном окне.

Контекст

32k

Цена ₽

1 / 0

Когда выбирать

  • Необходима высокая точность семантического поиска для англоязычных документов
  • Требуется создание качественных векторов для систем RAG и баз знаний
  • Нужна модель с размерностью 1024 для детального представления текстовых данных

Когда не выбирать

  • Требуется обработка текстов на языках, отличных от английского
  • Длина входного документа значительно превышает лимит в 512 токенов
  • Необходима генерация текста, а не создание векторных представлений

FAQ

МИРVisaMastercardСБП
AllTokens

© 2026 Alltokens. Все права защищены.

ИП Наумов Евгений Алексеевич · ИНН 434522560555 · ОГРНИП 324430000002724 · support@alltokens.ru