Анализ рынка ИИ: доллар, а не токен — главный показатель силы модели
Управляющий партнер венчурного фонда Dragonfly Хасиб Куреши выступил с важным заявлением, которое переворачивает привычное представление об оценке рынка ИИ-моделей. По его мнению, доля токенов — это крайне ненадежный и искажающий реальность показатель. Сравнивать модели необходимо исключительно по затраченным на их использование долларам. Анализ, основанный на сыром потреблении токенов на платформе OpenRouter, ведет к систематическим ошибкам и неверным выводам.
Куреши выделяет четыре ключевые проблемы такого подхода. Первая — это масштабные субсидии. Китайские лаборатории регулярно запускают новые модели с огромными скидками или вовсе бесплатным доступом. Это привлекает пользователей, которые перескакивают с одной бесплатной модели на другую, искусственно раздувая потребление токенов, но не тратя при этом реальных денег.
Вторая проблема — размер модели. Небольшие модели, такие как Qwen 3.5-27B, стоят примерно в сто раз дешевле за токен, чем флагманский Claude Opus. Рост использования Qwen на графике будет выглядеть как резкий скачок доли открытых моделей, хотя в денежном выражении это экономически незначимая величина. Анализировать, по его мнению, нужно внутри весовых категорий по размеру модели.
Третья проблема — это многогентные (multi-agent) системы. На одну и ту же сумму можно запустить сложную многогентную архитектуру на базе DeepSeek или GLM 5.2, которая будет «сжигать» в разы больше токенов, чем одна передовая модель вроде Opus или GPT-5.5 Pro. График покажет около 18% потери доли Opus, тогда как реальные траты сместятся лишь на 5%. «Такие графики преувеличивают значение низкоценных токенов», — подчеркивает Куреши.
Четвертая проблема — сама платформа OpenRouter. Крупные компании, определившись с одной передовой лабораторией, предпочитают обращаться к Anthropic или OpenAI напрямую, минуя наценку OpenRouter. На графике это выглядит как снижение доли США, хотя токены просто уходят за пределы платформы. Вывод Куреши: OpenRouter полезен для оценки доли внутри открытых моделей, но не подходит для сравнения открытых и закрытых.
Аналогичную мысль развивает основатель SageRoad Research Тревор Норен, связывая ее с ценовым давлением на индустрию. Он приводит оценку JPMorgan, согласно которой в будущем основное потребление токенов придется не на передовые, а на небольшие открытые модели, достаточные для конкретных задач.
По данным JPMorgan, Amazon уже предлагает около полутысячи открытых моделей по цене, составляющей долю от стоимости передовых. Nvidia совместно с Dell, Lenovo и HP создает компьютеры под ИИ-агентов. При этом собственные небольшие модели, такие как Claude Haiku и GPT-5.4-mini, пока неконкурентоспособны на «эффективной границе», которую сейчас доминируют китайские разработчики — DeepSeek, MiniMax, Xiaomi и Alibaba.
Особенно нагляден пример стоимости. Запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3,700 при результате 56 баллов, тогда как DeepSeek V4 Pro набирает 44 балла всего за $186 — примерно в 20 раз дешевле. Вывод: передовой уровень интеллекта нужен не для всего, а только там, где он необходим. GLM 5.2 от Z.ai выглядит сопоставимым с топовыми моделями Anthropic и OpenAI.
Норен считает, что коммодитизация моделей будет исходить не только от конкуренции передовых лабораторий, но и от компаний, которые ищут контроль над расходами через более дешевые узкоспециализированные модели. По его оценке, корпоративные траты остаются самым жизнеспособным путем для облачных гигантов окупить вложения в ИИ, но компании будут тратить как можно меньше.
Мнение эксперта: Обе позиции сходятся в одном: измерять рынок искусственного интеллекта нужно по деньгам, а не по токенам. Под давлением цен преимущество все чаще смещается к дешевым моделям. Это фундаментальный сдвиг, который инвесторы и аналитики обязаны учитывать при оценке сектора. Тот, кто продолжит смотреть на сырое потребление токенов, рискует пропустить реальную картину рынка.