Модель, токены и стоимость

Токен — единица, в которой модель «думает» и в которой провайдер берёт деньги.

Токен — кусочек текста (часть слова, слово или знак), на которые модель разбивает вход и выход. Оплата считается за токены входа и выхода отдельно.

Что такое токен на практике

Модель не видит буквы — она видит токены. Для английского текста грубо ~4 символа на токен (или ~0,75 слова на токен). Русский и код токенизируются «дороже»: на ту же мысль уходит больше токенов. Точное число даёт токенизатор провайдера, но для прикидки бюджета хватает грубой оценки.

Вход и выход считаются отдельно

Цены указывают как «$ за 1 млн входных токенов» и «$ за 1 млн выходных». Выход обычно в несколько раз дороже входа. Поэтому длинные ответы стоят заметно больше, чем длинные промпты.

Модель (пример)Вход $/1МВыход $/1МКогда
Claude Opus 4.8$5$25сложные задачи, агенты
Claude Sonnet 4.6$3$15баланс цены и качества
Claude Haiku 4.5$1$5простые, массовые задачи

Цены приведены как пример для расчётов и могут меняться — всегда сверяйтесь с актуальным прайсом провайдера.

Как выбирать модель

Не берите самую мощную модель «на всякий случай». Для классификации, коротких ответов, извлечения данных хватает быстрой дешёвой модели. Тяжёлую модель приберегите для рассуждений, кода, агентных циклов. На больших объёмах разница в цене между моделями — это тысячи долларов в месяц.

Грубый счётчик токенов (запускаемо)

Точную цифру даёт API провайдера (например, эндпоинт count_tokens), но прикинуть порядок можно простой эвристикой «символы / 4». Это оценка, не точный счёт:

def estimate_tokens(text):
    # Грубая эвристика: ~4 символа на токен
    return max(1, round(len(text) / 4))

prompt = "Summarize this article about climate change in three bullet points."
n = estimate_tokens(prompt)
print("Символов:", len(prompt))
print("Оценка токенов:", n)

price_in = 5.0   # $ за 1M входных токенов (пример)
cost = n / 1_000_000 * price_in
print(f"Оценка стоимости входа: ${cost:.6f}")

Вывод:

Символов: 67
Оценка токенов: 17
Оценка стоимости входа: $0.000085

Для русского текста та же эвристика занижает счёт — реальных токенов будет больше. Для точного учёта в продакшене используйте токенизатор/эндпоинт провайдера, а не приближение.

Итог

  • Модель оперирует токенами; оплата — за токены входа и выхода раздельно.
  • Выход дороже входа, длинные ответы стоят ощутимо больше.
  • Выбор модели — компромисс цена/качество под конкретную задачу.
  • Эвристика «символы/4» годится только для прикидки; точный счёт — у провайдера.
Проверьте себя
1. Что такое токен в контексте LLM?
AОдин символ текста
BКусочек текста (часть слова, слово или знак), на которые модель разбивает вход и выход
CОдин запрос к API
DЕдиница времени обработки
2. Что обычно дороже при оплате LLM API?
AВходные токены
BВыходные токены
CОни всегда стоят одинаково
DОплата идёт только за запросы, не за токены
3. Когда разумно выбрать быструю дешёвую модель вместо самой мощной?
AНикогда — мощная всегда лучше
BДля простых массовых задач: классификация, короткие ответы, извлечение данных
CТолько если кончились деньги
DДля самых сложных рассуждений
4. Насколько точна эвристика «символы / 4» для подсчёта токенов?
AЭто точный счёт, совпадает с провайдером
BЭто грубая оценка; для русского и кода она занижает реальное число токенов
CОна всегда завышает число токенов
DОна работает только для выходных токенов
Поддержать проект