Рынок ИИ: почему метрика «токены» вводит в заблуждение, а считать нужно в долларах
В последнее время в индустрии искусственного интеллекта стало модно сравнивать модели по объему потребляемых токенов. Однако, как показывают последние дискуссии среди ведущих аналитиков, такой подход фундаментально ошибочен. Управляющий партнер венчурной фирмы Dragonfly Хасиб Куреши справедливо указывает, что доля токенов — это крайне ненадежный показатель для оценки рынка ИИ-моделей. Реальную картину рыночной силы и востребованности дают только потраченные доллары, а не сырое потребление.
Почему же метрика токенов так искажает реальность? Куреши выделяет несколько ключевых проблем. Первая — это субсидии. Китайские лаборатории регулярно запускают новые модели с агрессивными скидками или даже бесплатным доступом. Это искусственно надувает объемы потребления токенов, так как пользователи мигрируют от одной бесплатной модели к другой, не тратя ни цента. Графики показывают бурный рост, а реальной монетизации за этим не стоит.
Размер имеет значение: цена за токен
Вторая проблема кроется в разном размере моделей. Небольшие модели, такие как Qwen 3.5-27B, могут быть в сто раз дешевле за токен, чем флагманские решения вроде Claude Opus. Резкий скачок доли потребления Qwen на графиках OpenRouter выглядит как триумф открытых моделей, но в экономическом выражении это ничтожная величина. Корректный анализ, по моему глубокому убеждению, возможен только внутри весовых категорий — сравнивать модели нужно в одном классе по размеру.
Третья проблема — это многоагентные системы. Вы можете потратить одну и ту же сумму на сложную конфигурацию на базе DeepSeek или GLM 5.2 и на один запрос к передовой модели Opus. Однако многоагентная архитектура «сожжет» в разы больше токенов за те же деньги. Куреши приводит наглядный пример: если 5% использования Opus мигрирует в такую систему с четырехкратным расходом токенов, график покажет потерю доли Opus в 18%, хотя реальные траты сместились лишь на 5%. Это классический пример того, как метрика токенов преувеличивает значение дешевых токенов.
OpenRouter: искаженное зеркало рынка
Четвертая проблема связана с выбором самой платформы OpenRouter. Крупные компании, определившись с одной передовой лабораторией, предпочитают работать с Anthropic или OpenAI напрямую, минуя наценку OpenRouter. На графике это выглядит как снижение доли США, хотя токены просто уходят за пределы платформы. Вывод очевиден: OpenRouter полезен для оценки доли внутри открытых моделей, но абсолютно не подходит для сравнения открытых и закрытых систем.
Эту позицию развивает и основатель SageRoad Research Тревор Норен, связывая ее с ценовым давлением на индустрию. Данные JPMorgan показывают, что многие токены в будущем будут потребляться не передовыми, а небольшими открытыми моделями, достаточными для конкретных задач. Amazon уже предлагает около полусотни открытых моделей по цене, составляющей долю от стоимости передовых.
Особенно показательны цифры от JPMorgan: запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3,700 при результате 56 баллов, тогда как DeepSeek V4 Pro набирает 44 балла всего за $186 — это примерно в 20 раз дешевле. По данным банка, собственные небольшие модели Claude Haiku и GPT-5.4-mini пока неконкурентоспособны на «эффективной границе», которую сейчас доминируют китайские разработчики — DeepSeek, MiniMax, Xiaomi и Alibaba.
Мой анализ как эксперта: Мы наблюдаем тектонический сдвиг. Коммодитизация моделей неизбежна, и она придет не только от конкуренции передовых лабораторий, но и от корпораций, ищущих контроль над расходами через более дешевые узкоспециализированные решения. Обе позиции сходятся в одном: измерять рынок ИИ нужно по деньгам, а не по токенам. Под давлением цен преимущество все чаще смещается к дешевым моделям, и инвесторам, следящим за крипто- и ИИ-сектором, стоит пересмотреть свои KPI. Традиционные метрики потребления токенов устарели — будущее за долларовой эффективностью.