Рынок ИИ: токены обманывают, считайте доллары
Управляющий партнер венчурной фирмы Dragonfly Хасиб Куреши выступил с важным заявлением: доля потребления токенов — крайне ненадежный показатель для оценки рынка ИИ-моделей. По его мнению, рынок необходимо измерять в долларах, а не в токенах. Анализ на основе сырого потребления токенов на платформе OpenRouter, уверен Куреши, ведет к фундаментально ошибочным выводам.
Четыре ловушки токеновой метрики
Первую проблему эксперт связывает с субсидиями. Китайские лаборатории регулярно запускают новые модели с большими скидками или вовсе бесплатным доступом. Это привлекает пользователей, которые мигрируют с одной бесплатной модели на другую, искусственно раздувая потребление токенов без соответствующего роста реальных денежных затрат.
Вторая проблема — разный размер моделей. Небольшие модели, такие как Qwen 3.5-27B, стоят примерно в сто раз дешевле за токен, чем флагманский Claude Opus. Рост использования Qwen может выглядеть на графике как резкий скачок доли открытых моделей, хотя в экономическом выражении это незначительная величина. Анализировать, по мнению Куреши, нужно внутри весовых категорий по размеру модели.
Третья проблема — многоагентные системы. Можно потратить одинаковую сумму на сложную многоагентную архитектуру на базе DeepSeek и на одну передовую модель вроде Opus. Однако многоагентная конфигурация сжигает гораздо больше токенов за те же деньги. Как отмечает Куреши, если 5% использования Opus мигрирует в такую систему с четырехкратным расходом токенов, график покажет потерю доли Opus примерно на 18%, хотя реальные траты сместятся лишь на 5%. Такие графики преувеличивают значение низкоценных токенов.
Четвертая проблема — в самой выборке OpenRouter. Если компания определилась с одной передовой лабораторией, ей выгоднее обращаться к Anthropic или OpenAI напрямую, минуя наценку платформы. На графике это выглядит как снижение доли американских моделей, хотя токены просто уходят за пределы платформы. Вывод Куреши: OpenRouter полезен для оценки доли внутри открытых моделей, но не подходит для сравнения открытых и закрытых.
Давление цен смещает рынок в сторону дешевых моделей
Схожую мысль развивает основатель SageRoad Research Тревор Норен, связывая ее с ценовым давлением на индустрию. Он приводит оценку JPMorgan: многие токены в будущем могут потребляться не передовыми, а небольшими открытыми моделями, которых достаточно для конкретных задач.
По данным JPMorgan, Amazon уже предлагает около полудюжины открытых моделей по цене, составляющей долю от стоимости передовых, а Nvidia совместно с Dell, Lenovo и HP создает компьютеры под ИИ-агентов. В банке отмечают, что собственные небольшие модели Claude Haiku и GPT-5.4-mini пока неконкурентоспособны на «эффективной границе», которую сейчас доминируют китайские разработчики — DeepSeek, MiniMax, Xiaomi и Alibaba.
Особенно нагляден пример стоимости. Запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3 700 при результате 56 баллов, тогда как DeepSeek V4 Pro набирает 44 балла всего за $186 — это примерно в 20 раз дешевле. Вывод: передовой уровень интеллекта нужен не для всего, а там, где он необходим, GLM 5.2 от Z.ai выглядит сопоставимым с топовыми моделями Anthropic и OpenAI.
Норен считает, что коммодитизация моделей придет не только от конкуренции передовых лабораторий, но и от компаний, ищущих контроль над расходами через более дешевые узкоспециализированные модели. Корпоративные траты остаются самым жизнеспособным путем для облачных гигантов окупить вложения в ИИ, но компании будут тратить как можно меньше.
Мнение эксперта: Обе позиции сходятся в одном: измерять рынок ИИ нужно по деньгам, а не по токенам. Под давлением цен преимущество все чаще смещается к дешевым моделям. Это фундаментальный сдвиг, который инвесторам и аналитикам стоит учитывать при оценке реальной динамики рынка.