GLM-5.2 от Z.ai: Реальный конкурент Claude или просто хайп на бенчмарках?
В мире ИИ разгорается новый ажиотаж. Китайская компания Z.ai выпустила модель GLM-5.2, которую в сети уже окрестили «убийцей» флагманского Claude от Anthropic. Спектакль подогревается заявлениями о десятикратном превосходстве при цене в десять раз ниже. Но так ли это на самом деле, или мы снова имеем дело с умелым маркетингом, а не реальным прорывом?
Технические характеристики и позиционирование
GLM-5.2 — это флагманская открытая модель, заточенная под длительные рабочие сессии. Ее ключевое преимущество — стабильное контекстное окно на 1 миллион токенов (против 200 тысяч у предшественника GLM-5.1). Это означает, что модель способна удерживать в поле зрения огромные объемы кода или текста без потери качества на протяжении часов. Модель предлагает два уровня усиления рассуждений: High (баланс производительности и расхода токенов) и Max (максимальная глубина, но с существенно большим потреблением ресурсов).
Важно: GLM-5.2 распространяется по открытой лицензии MIT без региональных ограничений, что позволяет запускать ее на собственном оборудовании (self-hosting). Это кардинально отличает ее от закрытых решений Anthropic.
Бенчмарки: Цифры не врут, но...
Согласно собственным тестам Z.ai, GLM-5.2 действительно демонстрирует впечатляющие результаты на стандартных бенчмарках. Например, на Terminal-Bench 2.1 она набрала 81,0 балла, что лишь на 4 пункта ниже показателя Opus 4.8 (85,0) и выше Gemini 3.1 Pro (74,0). На SWE-bench Pro — 62,1 балла, что почти догоняет GPT-5.5 (58,6) и Gemini (54,2).
Однако на более сложных и длительных задачах (long-horizon) разрыв с лидером становится заметным: на SWE-Marathon отставание от Opus 4.8 составляет 13%. Это говорит о том, что модель отлично справляется с изолированными задачами, но в условиях масштабного рефакторинга или создания сложных систем с нуля все еще уступает топовым продуктам.
Цена vs. Качество: Главный козырь или иллюзия?
Стоимость подписки GLM Coding Plan действительно привлекательна: от $12,6 в месяц (Lite) до $112 (Max) при годовой оплате. Однако, как отмечают пользователи, модель раскрывается только в режиме Max, который «сжигает» токены в разы быстрее, чем High. Это нивелирует преимущество в цене — при интенсивной работе затраты могут оказаться сопоставимыми с Claude или GPT.
Основные жалобы пользователей касаются нестабильной облачной инфраструктуры, склонности модели к бесконечным циклам и игнорированию команд. Многие отмечают, что GLM-5.2 «заточена» под бенчмарки, а в реальной разработке ведет себя как «бюджетный ИИ».
Вердикт аналитика
GLM-5.2 — это, безусловно, сильный шаг вперед для открытых моделей. Она демонстрирует, что Китай способен создавать конкурентоспособные решения, которые вплотную приближаются к лидерам рынка по ряду показателей. Однако называть ее «убийцей» Claude преждевременно. Да, она дешевле и доступнее, но по реальному user experience, стабильности и глубине анализа сложных проектов она пока уступает.
Мое мнение: GLM-5.2 — отличный инструмент для тех, кто готов пожертвовать удобством ради экономии и имеет возможность развернуть модель локально. Но для задач, где критична надежность и предсказуемость результата, Claude Opus 4.8 или GPT-5.5 остаются более безопасным выбором. Рынок ИИ становится все более фрагментированным, и «убийца» — это скорее кликбейт, чем реальность.