Рынок ИИ: доллар, а не токен — вот истинная мера силы
Управляющий партнер Dragonfly Хасиб Куреши выступил с резкой критикой текущего подхода к анализу рынка ИИ-моделей. Его главный тезис: доля потребляемых токенов — крайне ненадежный и вводящий в заблуждение показатель. Сравнивать модели нужно исключительно по потраченным долларам, а не по объему сгенерированных токенов. Этот тезис я считаю принципиально важным для понимания реальной динамики индустрии.
Четыре ловушки токеновой метрики
Первая проблема — субсидии. Китайские лаборатории регулярно запускают новые модели с агрессивными скидками или даже бесплатным доступом. Это привлекает пользователей, которые мигрируют между бесплатными моделями, раздувая потребление токенов, но не тратя реальных денег. Графики «доли рынка» в таком случае рисуют ложную картину.
Вторая проблема — разный размер моделей. Небольшая модель вроде Qwen 3.5-27B стоит примерно в сто раз дешевле за токен, чем флагманский Claude Opus. Рост использования Qwen может выглядеть как резкий скачок доли рынка, хотя экономически это — капля в море. Анализировать нужно внутри весовых категорий.
Третья проблема — мультиагентные системы. Одинаковую сумму можно потратить на сложную систему на базе DeepSeek или GLM 5.2 и на одну передовую модель вроде Opus или GPT-5.5 Pro. Но мультиагентная конфигурация «сожжет» гораздо больше токенов за те же деньги. Как точно заметил Куреши: если 5% использования Opus перетечет в такую систему с четырехкратным расходом токенов, график покажет ~18% потери доли Opus, хотя реальные траты сместятся лишь на 5%. Такие графики преувеличивают значение дешевых токенов.
Четвертая проблема — выборка OpenRouter. Крупные компании, определившись с одной передовой лабораторией, предпочитают работать напрямую с Anthropic или OpenAI, избегая наценки OpenRouter. На графиках это выглядит как снижение доли США, хотя токены просто уходят за пределы платформы. Вывод: OpenRouter полезен для оценки доли внутри открытых моделей, но не годится для сравнения открытых и закрытых.
Будущее — за дешевыми моделями?
Схожую мысль развил основатель SageRoad Research Тревор Норен, связав ее с ценовым давлением на индустрию. Он привел оценку JPMorgan: многие токены в будущем будут потребляться не передовыми, а небольшими открытыми моделями, которых достаточно для конкретных задач. Amazon уже предлагает около полусотни открытых моделей по цене, составляющей долю от стоимости передовых, а Nvidia вместе с Dell, Lenovo и HP создает компьютеры под ИИ-агентов.
Особенно нагляден пример стоимости. Запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3 700 при результате 56 баллов, тогда как DeepSeek V4 Pro набирает 44 балла всего за $186 — это примерно в 20 раз дешевле. Вывод: передовой уровень интеллекта нужен не для всего, а там, где он необходим, GLM 5.2 от Z.ai выглядит сопоставимым с топовыми моделями Anthropic и OpenAI.
Норен считает, что коммодитизация моделей придет не только от конкуренции передовых лабораторий, но и от компаний, ищущих контроль над расходами через более дешевые узкоспециализированные модели. Обе позиции сходятся в одном: измерять рынок искусственного интеллекта нужно по деньгам, а не по токенам, и под давлением цен преимущество все чаще смещается к дешевым моделям.
Мой вывод: рынок ИИ вступает в фазу зрелости, где метрики «голого объема» уступают место экономической эффективности. Инвесторы и аналитики, которые не перестроятся на долларовую оценку, рискуют пропустить тектонический сдвиг в сторону прагматичного выбора моделей. Китайские лаборатории уже захватили «эффективную границу» в сегменте небольших моделей, и это меняет правила игры.