GLM-5.2: Реальный конкурент Claude или просто громкий маркетинговый ход?
В мире искусственного интеллекта назревает серьезная интрига. Новая модель GLM-5.2 от китайской компании Z.ai стремительно ворвалась в топ обсуждений, и многие уже окрестили ее «убийцей» флагманского продукта Anthropic — Claude. Давайте разберемся, насколько эти заявления обоснованы и что на самом деле представляет собой эта нейросеть.
Архитектура и ключевые особенности
GLM-5.2 — это не просто очередное обновление, а флагманская модель, созданная для продолжительных и сложных рабочих сессий. Главное ее отличие от предшественника GLM-5.1 — это гигантский скачок в объеме контекстного окна. Если раньше оно составляло 200 тысяч токенов, то теперь — 1 миллион. Это означает, что модель способна удерживать в поле зрения и анализировать огромные объемы кода и текста без потери качества на протяжении длительных проектов.
Ключевые параметры модели:
- Контекст в 1 млн токенов: Не деградирует при сверхдлинных сессиях, позволяя работать с целой кодовой базой в одном цикле рассуждений.
- Два уровня рассуждений: Режим «High» для баланса производительности и расхода токенов, и режим «Max» для максимальной глубины анализа, требующий больше ресурсов.
- Открытая лицензия MIT: Полная свобода действий — от self-hosting на собственном оборудовании до коммерческого использования без региональных ограничений.
- Цена API: Стоимость обращения осталась на уровне предыдущей версии GLM-5.1, что делает ее привлекательной для разработчиков.
Модель уже доступна на HuggingFace и ModelScope, а также через подписку GLM Coding Plan, десктопный агент ZCode и среды Claude Code и OpenCode.
Цифры и бенчмарки: что показывает реальная производительность?
По собственным тестам Z.ai, GLM-5.2 позиционируется как сильнейшая открытая модель на рынке. Однако до лидера — Anthropic Claude Opus 4.8 — она в большинстве сценариев все же не дотягивает. Давайте посмотрим на сухие цифры в режиме максимального рассуждения:
| Бенчмарк | GLM-5.2 | GLM-5.1 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|---|
| SWE-bench Pro | 62,1 | 58,4 | 69,2 | 58,6 | 54,2 |
| Terminal-Bench 2.1 | 81,0 | 63,5 | 85,0 | 84,0 | 74,0 |
| NL2Repo | 48,9 | 42,7 | 69,7 | 50,7 | 33,4 |
| DeepSWE | 46,2 | 18,0 | 58,0 | 70,0 | 10,0 |
| ProgramBench | 63,7 | 50,9 | 71,9 | 70,8 | 39,5 |
| MCP-Atlas | 76,8 | 71,8 | 77,8 | 75,3 | 69,2 |
| Tool-Decathlon | 48,2 | 40,7 | 59,9 | 55,6 | 48,8 |
Как видно, GLM-5.2 демонстрирует впечатляющий рост относительно своей предыдущей версии, особенно на тестах Terminal-Bench 2.1 (81,0 против 63,5) и DeepSWE (46,2 против 18,0). Она уверенно обходит Gemini 3.1 Pro и GPT-5.5 по ряду показателей, но все еще уступает Opus 4.8. На тесте длительных проектов FrontierSWE отставание от лидера составляет всего 1%, что говорит о колоссальном прогрессе в работе с долгими сценариями.
Цена вопроса: дешево, но не всегда стабильно
Подписка GLM Coding Plan предлагает три тарифа с 30% скидкой при годовой оплате: Lite за $12,6/мес, Pro за $50,4/мес и Max за $112/мес. Расход квоты зависит от нагрузки: коэффициент 3x в часы пик (с 14:00 до 18:00 по пекинскому времени) и 2x вне пика. До конца сентября действует акция, где внепиковое использование тарифицируется как 1x.
Пользователи отмечают, что модель раскрывается только в режиме Max, который потребляет значительно больше токенов. При этом облачная инфраструктура критикуется как крайне слабая, а поддержка — недостаточная. Многие разработчики жалуются, что проще заплатить за Claude или GPT, чем мириться с нестабильностью сервиса Z.ai.
Реальные отзывы: энтузиазм vs. разочарование
Мнения пользователей разделились. Сильные стороны модели:
- Лучшая открытая модель для программирования и автономных задач на данный момент.
- Базовая логика заметно улучшена по сравнению с версией 5.1.
- Способность самостоятельно выполнять сложные задачи через вспомогательных агентов и предлагать исправления.
- Настойчивость в достижении цели, несмотря на медлительность и дороговизну.
Критика касается в первую очередь сервиса и стабильности:
- Слабая облачная инфраструктура при хорошей математической модели.
- Высокая стоимость тарификации и слабая поддержка.
- Склонность застревать в бесконечных циклах и игнорировать команды пользователя.
- Подозрение, что модель «заточена» исключительно под бенчмарки.
Вердикт аналитика: убийца или нет?
Однозначного ответа нет. GLM-5.2 — безусловно, сильнейшая открытая модель на сегодняшний день. Она вплотную приблизилась к флагману Anthropic в отдельных сценариях, особенно в длительных проектах. Открытая лицензия MIT, возможность self-hosting и низкий порог входа делают ее заметным игроком на рынке.
Однако называть ее «убийцей» Claude преждевременно. По большинству тестов Z.ai сама ставит свою модель ниже Opus 4.8. К тому же, сырая и нестабильная инфраструктура, высокий расход токенов и слабая поддержка сводят на нет многие преимущества. Пока что GLM-5.2 — это многообещающий, но не завершенный продукт, который сокращает разрыв с лидерами, но не превосходит их.
Мое профессиональное мнение: GLM-5.2 — это важный шаг для индустрии открытых ИИ-моделей, демонстрирующий, что конкуренция с закрытыми гигантами возможна. Однако для массового принятия разработчикам Z.ai предстоит решить проблемы с инфраструктурой и стабильностью. Пока же это инструмент для энтузиастов и тех, кто готов мириться с несовершенствами ради доступа к передовой открытой архитектуре.