Question 1

Зачем использовать AllTokens?

Accepted Answer

AllTokens дает единый API для доступа к большим LLM-моделям, общий биллинг и прозрачную аналитику. Вы интегрируетесь один раз, а дальше управляете моделями и провайдерами из одного интерфейса без переписывания кода под каждого вендора.

Question 2

Как быстро начать?

Accepted Answer

Создайте аккаунт, пополните баланс в кабинете и выпустите API-ключ. После этого можно сразу тестировать модели в чате или отправлять запросы через API. Для интеграции в проект используйте документацию и примеры из раздела для разработчиков.

Question 3

Как получить поддержку?

Accepted Answer

По продуктовым и техническим вопросам используйте каналы поддержки, указанные в кабинете и на сайте. Для вопросов по биллингу и аккаунту лучше писать в поддержку из личного кабинета, чтобы команда сразу видела ваш профиль и историю операций.

Question 4

Как списывается стоимость запросов?

Accepted Answer

Стоимость считается по фактическому потреблению токенов: входные + выходные токены модели. Формула: (input_tokens / 1 000 000 × цена входа) + (output_tokens / 1 000 000 × цена выхода). Пример: 120 000 входных и 30 000 выходных токенов при 40 ₽/M и 120 ₽/M = 8.4 ₽.

Question 5

Что такое миллионы входных и выходных токенов и как они расходуются?

Accepted Answer

Цена обычно указывается отдельно за 1 миллион входных и за 1 миллион выходных токенов. Входные токены — это все, что вы отправили модели: системный промпт, сообщение пользователя, история диалога, tool calls и дополнительный контекст. Выходные токены — это все, что модель сгенерировала в ответ. Стоимость считается по двум частям: вход + выход. Если запрос длинный, растут входные токены. Если ответ длинный, растут выходные токены. Пример: короткий вопрос и длинное объяснение в основном расходуют выходные токены.

Question 6

Какие комиссии в AllTokens?

Accepted Answer

Комиссия платформы учитывается в итоговом списании и показывается прозрачно в экономике использования. Для крупных объемов могут действовать индивидуальные коммерческие условия.

Question 7

Есть ли комиссия при BYOK?

Accepted Answer

При BYOK вы работаете со своими ключами провайдеров и оплачиваете их напрямую, а AllTokens дает единый роутинг, аналитику и управление доступом. Условия по BYOK зависят от вашего режима подключения и фиксируются в кабинете.

Question 8

Считаются ли стриминг и обычные ответы по-разному?

Accepted Answer

Нет, биллинг одинаковый: по фактически сгенерированным токенам. Streaming влияет только на способ доставки ответа клиенту, но не меняет сам принцип расчета стоимости.

Question 9

Считаются ли неуспешные и fallback-запросы?

Accepted Answer

Если запрос завершился ошибкой без ответа модели, списания не происходит. Если включен fallback и резервный провайдер успешно вернул результат, тарифицируется только успешный ответ, который вы реально получили.

Question 10

Есть ли минимальный обязательный расход?

Accepted Answer

Нет, вы оплачиваете фактическое использование. Пример: если за месяц нагенерировано токенов на 300 ₽, списание составит 300 ₽.

Question 11

Какие модели поддерживаются?

Accepted Answer

В каталоге AllTokens доступны сотни моделей от разных провайдеров: чат, код, reasoning и мультимодальные сценарии. Актуальный список смотрите на странице моделей и в API-эндпоинте моделей.

Question 12

Как часто добавляются новые модели?

Accepted Answer

Каталог обновляется регулярно: новые модели появляются по мере подключения провайдеров и релизов лабораторий. На странице моделей новые позиции можно отслеживать по соответствующей метке.

Question 13

Что такое варианты моделей?

Accepted Answer

Варианты позволяют выбрать конкретное поведение или тип маршрутизации для одной и той же базовой модели. Набор доступных вариантов зависит от модели и провайдера, поэтому ориентируйтесь на карточку модели в каталоге.

Question 14

Я провайдер инференса. Как попасть в AllTokens?

Accepted Answer

Подготовьте описание API, параметры SLA и условия тарификации, после чего свяжитесь с командой платформы через контакты на сайте. Подключение проходит валидацию по стабильности, совместимости и качеству ответов.

Question 15

Какой ожидать latency у моделей?

Accepted Answer

Задержка зависит от выбранной модели, провайдера и нагрузки. В AllTokens можно смотреть реальные метрики по latency и throughput в аналитике и выбирать более быстрый маршрут для production-нагрузки.

Question 16

Как работает fallback, если провайдер недоступен?

Accepted Answer

При ошибке основного маршрута запрос автоматически отправляется в резервный маршрут по заданной политике. Пример: `provider A / model X` как основной и `provider B / model X-compatible` как резерв.

Question 17

Какие методы аутентификации поддерживаются?

Accepted Answer

Для API-запросов используется API-ключ. Для работы в веб-интерфейсе применяется сессионная авторизация аккаунта. Ключи можно выпускать, отзывать и ограничивать по окружениям.

Question 18

Как считаются rate limits?

Accepted Answer

Лимиты зависят от аккаунта, режима работы и текущей нагрузки платформы. Текущие ограничения и их изменение по времени отображаются в кабинете и применяются на уровне ключей и маршрутов.

Question 19

Какие API-эндпоинты доступны?

Accepted Answer

Доступны совместимые с OpenAI-форматом эндпоинты для генерации, а также платформенные эндпоинты каталога моделей и аналитики. Актуальную спецификацию и примеры запросов смотрите в документации AllTokens.

Question 20

Какие форматы входа поддерживаются?

Accepted Answer

Базово поддерживаются текстовые сценарии, а для части моделей доступны изображения и другие мультимодальные входы. Конкретные возможности зависят от модели и указываются в ее карточке.

Question 21

Как работает streaming?

Accepted Answer

Streaming отдает ответ по мере генерации токенов, без ожидания полного завершения. Это удобно для чат-интерфейсов и long-form задач, где важен быстрый первый токен.

Question 22

Какие SDK поддерживаются?

Accepted Answer

Поскольку API совместим с распространенным OpenAI-форматом, обычно подходят существующие SDK и клиентские библиотеки без существенных изменений бизнес-логики.

Question 23

Какие данные логируются при использовании API?

Accepted Answer

Логируются технические метаданные: время запроса, модель, токены, стоимость, статусы и ошибки. Эти данные нужны для аналитики, диагностики и контроля расходов.

Question 24

Что логируется при работе в чате?

Accepted Answer

История чатов хранится в интерфейсе аккаунта и используется для удобства работы пользователя. Для production-интеграций через API рекомендуется отдельно вести собственный журнал бизнес-событий на вашей стороне.

Question 25

Передаются ли данные третьим сторонам?

Accepted Answer

Запросы передаются выбранным провайдерам моделей для выполнения инференса. AllTokens выступает как маршрутизирующий слой между вашим приложением и провайдерами.

Question 26

Используются ли данные клиентов для обучения моделей AllTokens?

Accepted Answer

Нет, AllTokens не использует данные клиентских запросов для обучения собственных моделей. Платформа предоставляет инфраструктуру маршрутизации, биллинга и аналитики.

Question 27

Как пополнять баланс?

Accepted Answer

Баланс пополняется в личном кабинете. После пополнения средства сразу доступны для API-запросов и чата. Все операции отображаются в истории баланса.

Question 28

Как мониторить расход средств?

Accepted Answer

Используйте раздел аналитики и историю операций: там видно токены, стоимость, модель, провайдера и период. Для контроля бюджета удобно задавать отдельные ключи и лимиты под каждое окружение.

Question 29

Есть ли бесплатные модели для теста?

Accepted Answer

Да, в каталоге есть бесплатные модели с ограничениями по лимитам. Они подходят для проверки интеграции и прототипов, а production-нагрузку лучше переводить на стабильные коммерческие маршруты.

Question 30

Какие способы оплаты поддерживаются?

Accepted Answer

Доступные способы оплаты зависят от аккаунта и региона и отображаются в кабинете при пополнении. Для корпоративных подключений возможна оплата по счету.

Question 31

Как AllTokens зарабатывает?

Accepted Answer

Платформа монетизируется за счет сервисной комиссии и инфраструктурных сервисов: роутинг, аналитика, отказоустойчивость, управление ключами и корпоративные функции.

Question 32

Как удалить аккаунт?

Accepted Answer

Управление аккаунтом доступно в настройках профиля. Перед удалением убедитесь, что выгружены нужные данные и закрыты задачи по доступам команды.

Question 33

Как работает командный доступ?

Accepted Answer

Для командной работы используются отдельные ключи, роли и изоляция по окружениям/проектам. Это позволяет разделять доступ и расходы между разработкой, тестом и production.

Question 34

Какая аналитика доступна?

Accepted Answer

В кабинете доступны метрики по токенам, стоимости, задержке, ошибкам, моделям и провайдерам. Эти данные позволяют быстро находить узкие места и оптимизировать экономику инференса.

Question 35

Как связаться с поддержкой по аккаунту и биллингу?

Accepted Answer

Используйте контакты поддержки в кабинете. Для быстрого решения приложите ID аккаунта, время операции и скрин из истории баланса или лога запроса.

Частые вопросы

Дополнительно: вопросы по интеграции LLM API

Практический чек-лист перед запуском

Источники и методология

Продукт

Платформа

Контент

Разработчикам

Право

Контакты