ИИ-рынок: метрика успеха — доллар, а не токен
Управляющий партнер венчурной фирмы Dragonfly Хасиб Куреши выступил с резкой критикой текущей практики оценки рынка ИИ-моделей. Его главный тезис: доля потребления токенов — это вводящий в заблуждение и зачастую ошибочный показатель. Единственно верный способ сравнения, по его мнению, — это анализ денежных затрат, а не сырые данные о количестве токенов.
Четыре проблемы токеновой метрики
Куреши выделяет четыре системных искажения, которые делают анализ на основе токенов на платформе OpenRouter практически бесполезным для оценки реального рыночного положения.
1. Субсидии и «бесплатный сыр». Китайские лаборатории регулярно запускают новые модели с агрессивными скидками или бесплатным доступом. Это привлекает пользователей, которые мигрируют с одной бесплатной модели на другую, создавая иллюзию бурного роста потребления токенов, но не принося при этом реальной денежной выручки.
2. Размер модели. Небольшие модели, такие как Qwen 3.5-27B, примерно в сто раз дешевле за токен, чем флагманские Claude Opus или GPT-5.5 Pro. Рост их использования может выглядеть как резкий скачок доли на графике, хотя экономически это абсолютно незначительная величина. Анализировать рынок, по мнению Куреши, нужно строго внутри весовых категорий по размеру модели.
3. Многоагентные системы. На одну и ту же сумму можно запустить сложную многоагентную архитектуру на базе DeepSeek, которая «сожжет» в разы больше токенов, чем один запрос к премиальной модели Opus. Куреши приводит наглядный пример: если 5% использования Opus перейдет в такую систему с четырехкратным расходом токенов, график покажет потерю доли Opus в 18%, в то время как реальные траты клиента сместятся лишь на 5%. Это грубое искажение картины.
4. Выборка платформы. OpenRouter — не универсальный репрезентативный срез рынка. Крупные компании, определившись с лабораторией, предпочитают работать напрямую с Anthropic или OpenAI, минуя наценку платформы. На графике это выглядит как падение доли американских моделей, хотя токены просто уходят за пределы платформы. OpenRouter полезен для анализа доли внутри сегмента открытых моделей, но абсолютно не подходит для сравнения открытых и закрытых.
Ценовое давление и будущее за дешевыми моделями
Эту точку зрения развивает основатель SageRoad Research Тревор Норен, связывая ее с жестким ценовым давлением на индустрию. Он приводит оценку JPMorgan, согласно которой Amazon уже предлагает около половины открытых моделей по цене, составляющей лишь долю от стоимости флагманских. Nvidia совместно с Dell, Lenovo и HP создает компьютеры под ИИ-агентов, что также способствует смещению спроса.
Наиболее яркий пример — соотношение цены и качества. Запуск набора задач Artificial Analysis Intelligence Index на Claude Opus 4.8 обходится в $3,700 при результате 56 баллов. DeepSeek V4 Pro набирает 44 балла всего за $186 — примерно в 20 раз дешевле. Вывод Норена однозначен: топовый интеллект нужен не для всего. Для подавляющего большинства корпоративных задач достаточно дешевых, узкоспециализированных моделей, и контроль над расходами будет главным драйвером этого смещения.
Мнение эксперта: Аргументы Куреши и Норена бьют прямо в яблочко. Рынок ИИ перегрет метриками тщеславия (vanity metrics). Инвесторы и аналитики, которые продолжают смотреть на «сырые» токены, рискуют пропустить тектонический сдвиг в сторону эффективности и экономии. Реальная битва в ИИ будет идти не за лучший бенчмарк, а за лучший price-to-performance ratio. Китайские лаборатории DeepSeek и Alibaba уже выигрывают эту войну, и западным гигантам придется либо радикально снижать цены, либо сдавать позиции в корпоративном сегменте.