GLM-5.2: Реальный конкурент Claude или просто громкий маркетинг?
На рынке искусственного интеллекта появился новый игрок, который сразу же привлек внимание крипто- и техносообщества. Речь идет о нейросети GLM-5.2 от компании Z.ai, которую некоторые энтузиасты уже поспешили назвать «убийцей» флагманской модели Anthropic — Claude. Давайте разберемся, насколько обоснованы такие заявления, и что на самом деле представляет собой эта модель.
Что такое GLM-5.2 и чем она интересна?
GLM-5.2 — это флагманская модель, разработанная Z.ai, ориентированная на длительные и сложные рабочие сессии. Ее ключевое отличие от предшественницы GLM-5.1 — стабильное контекстное окно на 1 миллион токенов, что в пять раз больше, чем у предыдущей версии (200 тысяч токенов). Это позволяет модели удерживать в «поле зрения» огромные объемы кода и текста без деградации производительности.
Основные характеристики модели включают в себя два уровня усиления рассуждений: High (баланс производительности и затрат) и Max (максимальная производительность за счет большего расхода токенов). Важно отметить, что модель распространяется по открытой лицензии MIT, что позволяет запускать ее на собственном оборудовании (self-hosting).
Бенчмарки: цифры не врут, но требуют контекста
По данным внутренних тестов Z.ai, GLM-5.2 показывает впечатляющие результаты, особенно в задачах программирования. На тесте Terminal-Bench 2.1 она набрала 81,0 балла, что значительно выше 63,5 у GLM-5.1 и даже превосходит Gemini 3.1 Pro (74,0), хотя и уступает лидеру — Claude Opus 4.8 (85,0).
Однако на других бенчмарках, таких как SWE-bench Pro (62,1 против 69,2 у Opus 4.8) и NL2Repo (48,9 против 69,7), отставание от флагмана Anthropic становится более заметным. Тем не менее, на тесте FrontierSWE, который имитирует длительные технические проекты, разрыв составляет всего 1%, что говорит о серьезном прогрессе.
Цена и реальный опыт пользователей
Подписка на GLM-5.2 предлагается по трем тарифам: Lite ($12.6/мес), Pro ($50.4/мес) и Max ($112/мес) при годовой оплате. Однако пользователи отмечают, что модель раскрывает свой потенциал только в режиме Max, который потребляет значительно больше токенов.
В сообществе мнения разделились. Одни хвалят модель за превосходную логику и способность автономно решать сложные задачи, сравнивая ее с GPT-5.5 на высоком уровне рассуждений. Другие критикуют за слабую облачную инфраструктуру, высокую стоимость и склонность к зацикливанию. Есть мнение, что модель «заточена» исключительно под бенчмарки, а в реальных сценариях уступает более зрелым решениям.
Вердикт: «убийца» или нет?
Однозначного ответа нет. GLM-5.2 — это, безусловно, мощная открытая модель, которая демонстрирует впечатляющие результаты в некоторых задачах, особенно в длительных сценариях и работе с большим контекстом. Она сокращает разрыв с лидерами рынка, но пока не превосходит их.
Назвать ее «убийцей» Claude — это скорее громкий заголовок, чем объективная реальность. Пользовательский опыт указывает на нестабильность сервиса и высокие затраты, что делает модель привлекательной в первую очередь для энтузиастов и разработчиков, готовых работать с self-hosting, а не для массового рынка.
Мой экспертный взгляд: GLM-5.2 — это значительный шаг вперед для открытых моделей, но называть ее прямым конкурентом Claude пока преждевременно. Z.ai удалось создать сильный продукт для нишевых задач, но для того, чтобы стать массовым «убийцей», необходимо решить проблемы с инфраструктурой и стоимостью. Пока что это скорее «бюджетный» кандидат, который может заменить Claude в специфических сценариях, но не превзойти его.