Истинная стоимость ИИ-моделей: почему доллар важнее токенов
Анализ рынка ИИ-моделей на основе потребления токенов — это путь к фундаментально неверным выводам. К такому заключению приходят ведущие эксперты отрасли, указывая на то, что реальным мерилом конкурентоспособности и востребованности должны быть долларовые затраты пользователей, а не сырые показатели использования токенов.
Проблема №1: Искажение данных субсидиями
Китайские лаборатории активно используют агрессивную ценовую стратегию, запуская новые модели с огромными скидками или даже бесплатным доступом. Это создает иллюзию высокого спроса: пользователи переключаются между бесплатными моделями, накручивая статистику потребления токенов, но при этом не тратят реальных денег. Сравнивать такую активность с платным использованием флагманских моделей — заведомо ошибочно.
Проблема №2: Размер модели имеет значение
Небольшие модели, такие как Qwen 3.5-27B, могут быть в сто раз дешевле за токен, чем, скажем, Claude Opus. Резкий скачок доли использования дешевых моделей на графиках OpenRouter выглядит как триумф открытого ИИ, однако в денежном выражении это может быть абсолютно незначимая величина. Анализировать рынок необходимо строго внутри весовых категорий, сравнивая сопоставимые по размеру модели.
Проблема №3: Мультиагентные системы
Современные архитектуры, использующие каскады из нескольких моделей (например, на базе DeepSeek), сжигают гораздо больше токенов за те же деньги, что и одна мощная модель. Если 5% использования Opus перетечет в такую систему с четырехкратным расходом токенов, график покажет потерю доли Opus в 18%, тогда как реальные долларовые затраты снизятся лишь на 5%. Токены преувеличивают значимость дешевых решений.
Проблема №4: Ограниченность платформы OpenRouter
Крупные корпорации, определившись с провайдером, предпочитают работать напрямую с Anthropic или OpenAI, минуя наценку OpenRouter. Это означает, что снижение доли американских моделей на платформе не отражает реальный отток клиентов — токены просто уходят за пределы видимости OpenRouter. Платформа полезна для оценки трендов внутри сегмента открытых моделей, но абсолютно непригодна для сравнения открытых и закрытых экосистем.
Будущее за дешевыми моделями?
JPMorgan приводит яркий пример: запуск бенчмарка на Claude Opus 4.8 стоит $3,700 (результат 56 баллов), тогда как DeepSeek V4 Pro достигает 44 баллов всего за $186 — в 20 раз дешевле. Amazon уже предлагает полдюжины открытых моделей по цене, составляющей долю от стоимости проприетарных аналогов, а Nvidia совместно с Dell, Lenovo и HP создает компьютеры под ИИ-агентов. Корпоративные расходы остаются главным драйвером окупаемости инвестиций в ИИ, но компании будут минимизировать затраты.
Мой вывод: Индустрия движется к коммодитизации. Ведущие позиции на «эффективной границе» сейчас занимают китайские разработчики — DeepSeek, MiniMax, Xiaomi и Alibaba. Измерение рынка в долларах, а не в токенах, неизбежно сместит фокус анализа в сторону дешевых, узкоспециализированных моделей. И это не вопрос будущего — это уже происходит прямо сейчас.