GLM-5.2 от Z.ai: Действительно ли эта китайская модель стала «убийцей» Claude? Разбор эксперта

18.06.2026

05:02

В мире искусственного интеллекта назревает сенсация. Новая открытая модель GLM-5.2 от компании Z.ai, по мнению многих энтузиастов, бросает серьезный вызов флагманским продуктам Anthropic — моделям семейства Claude. Некоторые уже поспешили назвать ее «китайским убийцей» Claude, и у этого есть веские основания.

Давайте разберемся, что же представляет собой GLM-5.2 и насколько справедливы такие громкие заявления. Это не просто очередное обновление. Главное новшество — расширенное контекстное окно на 1 миллион токенов, что в пять раз больше, чем у предшественника GLM-5.1. Это позволяет модели удерживать в поле зрения целые кодовые базы и вести длительные, сложные сессии без потери качества. Кроме того, модель предлагает два режима «усиления рассуждений»: High для баланса производительности и расхода токенов, и Max — для максимальной точности, но с повышенным потреблением ресурсов.

Ключевое преимущество — открытая лицензия MIT, которая снимает региональные ограничения и позволяет запускать модель на собственном оборудовании (self-hosting). Это делает GLM-5.2 невероятно привлекательной для разработчиков и компаний, заботящихся о конфиденциальности данных.

Бенчмарки: Цифры не врут, но есть нюансы

По данным внутренних тестов Z.ai, GLM-5.2 действительно демонстрирует впечатляющие результаты, особенно в задачах программирования. На тесте Terminal-Bench 2.1 она показала 81,0 балла, что практически вплотную приближается к показателю Claude Opus 4.8 (85,0) и значительно превосходит Gemini 3.1 Pro (74,0). На SWE-bench Pro результат 62,1 против 58,4 у GLM-5.1, хотя до показателя Opus 4.8 (69,2) все еще далеко.

Однако, если посмотреть на другие бенчмарки, картина становится более сложной. На NL2Repo, который оценивает генерацию целого проекта по текстовому описанию, GLM-5.2 (48,9) серьезно уступает Opus 4.8 (69,7). На DeepSWE разрыв еще более значительный: 46,2 против 58,0. То есть, в ряде сложных, комплексных сценариев китайская модель пока не дотягивает до лидера.

Тем не менее, на длительных задачах (long-horizon), таких как FrontierSWE, где модель должна вести проект десятками часов, GLM-5.2 отстает от Opus 4.8 всего на 1%, обгоняя при этом GPT-5.5 и предыдущую версию Opus 4.7. Это говорит о том, что новинка отлично справляется с поддержанием контекста и последовательностью в длительных сессиях.

Цена и реальный опыт пользователей

Стоимость подписки GLM Coding Plan начинается от $12.6 в месяц за тариф Lite (при годовой оплате), что действительно в разы дешевле подписок на Claude или GPT. Max-тариф обойдется в $112 в месяц. Однако, как отмечают пользователи, «дьявол кроется в деталях». Режим Max, в котором модель раскрывает свой потенциал, расходует значительно больше токенов, что при активном использовании может быстро «съесть» лимит.

Отзывы пользователей разделились. С одной стороны, хвалят базовую логику, которая стала заметно лучше, и способность автономно решать сложные задачи, предлагая исправления. С другой — критикуют нестабильную облачную инфраструктуру, высокую стоимость режима Max и склонность модели «зацикливаться» в бесконечных циклах рассуждений, игнорируя команды пользователя. Многие отмечают, что GLM-5.2 «заточена» под бенчмарки, а в реальной работе с кодом ведет себя как модель «бюджетного плана».

Мой вердикт: Называть GLM-5.2 «убийцей» Claude пока преждевременно. Это, безусловно, сильнейшая открытая модель на сегодняшний день, которая сокращает разрыв с лидерами рынка и предлагает уникальные преимущества в виде открытой лицензии и огромного контекстного окна. Для разработчиков, которые ценят конфиденциальность и готовы мириться с некоторыми «детскими болезнями» инфраструктуры, это отличный и экономически выгодный инструмент. Однако, для бескомпромиссного качества и стабильности, флагманы Anthropic и OpenAI пока остаются вне конкуренции. Рынок ИИ становится все более конкурентным, и это, безусловно, идет на пользу всем нам.

Новости криптомира