Иллюзия токенов: почему рынок ИИ нужно оценивать в долларах, а не в единицах потребления
В последнее время в индустрии искусственного интеллекта наметилась опасная тенденция: аналитики и журналисты всё чаще опираются на сырые данные о потреблении токенов для оценки рыночной доли моделей. Как профессиональный аналитик, я считаю такой подход в корне неверным и вводящим в заблуждение. Управляющий партнер Dragonfly Хасиб Куреши недавно ярко аргументировал, почему доля токенов — это плохой метрика, и предложил измерять рынок по реальным денежным затратам. Давайте разберем его логику.
Четыре «ловушки» токеновой статистики
Первая и, пожалуй, самая очевидная проблема — это субсидии. Китайские лаборатории регулярно запускают новые модели с огромными скидками или даже бесплатным доступом. Это привлекает массу пользователей, которые перескакивают с одной бесплатной модели на другую, искусственно раздувая потребление токенов, но не принося при этом ни копейки реальной выручки. Графики использования в таких случаях рисуют красивый рост, который не имеет ничего общего с экономической реальностью.
Вторая проблема связана с размером моделей. Небольшие модели, такие как Qwen 3.5-27B, стоят примерно в сто раз дешевле за токен, чем флагманский Claude Opus. Рост использования Qwen может выглядеть на графике как резкий скачок доли открытых моделей, хотя экономически это совершенно незначительная величина. Анализировать рынок, не разделяя модели по весовым категориям, — это сравнивать слонов с муравьями.
Третья проблема — многоагентные системы. Можно потратить одинаковую сумму на сложную многоагентную архитектуру на базе DeepSeek или GLM 5.2 и на одну передовую модель вроде Opus или GPT-5.5 Pro. Но при сопоставимой производительности многоагентная конфигурация будет сжигать гораздо больше токенов за те же деньги. Как точно подметил Куреши, если 5% использования Opus сместится в такую систему с четырехкратным расходом токенов, график покажет падение доли Opus на 18%, хотя реальные траты снизились лишь на 5%. Это грубое искажение картины.
Четвертая проблема — ограниченность самой платформы OpenRouter. Если компания определилась с одной передовой лабораторией, ей выгоднее обращаться к Anthropic или OpenAI напрямую, а не через OpenRouter с его наценкой. На графике это будет выглядеть как снижение доли США, хотя токены просто уходят за пределы платформы. OpenRouter полезен для оценки доли внутри открытых моделей, но категорически не подходит для сравнения открытых и закрытых.
Будущее — за дешевыми моделями?
Основатель SageRoad Research Тревор Норен развивает схожую мысль, связывая её с ценовым давлением на индустрию. Он приводит оценку JPMorgan: многие токены в будущем могут потребляться не передовыми, а небольшими открытыми моделями, которых достаточно для конкретных задач. Amazon уже предлагает около полусотни открытых моделей по цене, составляющей долю от стоимости передовых. Nvidia вместе с Dell, Lenovo и HP создает компьютеры под ИИ-агентов.
Особенно показателен пример стоимости. По данным JPMorgan, запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3 700 при результате 56 баллов, тогда как DeepSeek V4 Pro набирает 44 балла всего за $186 — это примерно в 20 раз дешевле. Вывод очевиден: передовой уровень интеллекта нужен не для всего, а только там, где он действительно необходим. GLM 5.2 от Z.ai выглядит сопоставимым с топовыми моделями Anthropic и OpenAI.
Норен считает, что коммодитизация моделей придет не только от конкуренции передовых лабораторий, но и от компаний, которые ищут контроль над расходами через более дешевые узкоспециализированные модели.
Мой вывод как аналитика: обе позиции сходятся в одном — рынок искусственного интеллекта нужно измерять по деньгам, а не по токенам. Под давлением цен преимущество все чаще смещается к дешевым моделям. Это фундаментальный сдвиг, который инвесторам и разработчикам стоит учитывать уже сегодня. Те, кто продолжит смотреть на сырые графики потребления токенов, рискуют пропустить реальную картину перераспределения капитала в индустрии.