GLM-5.2 от Z.ai: Действительно ли новая китайская модель «убивает» Claude? Разбор аналитика
В последние дни криптосообщество и ИИ-энтузиасты активно обсуждают новую модель GLM-5.2 от китайской компании Z.ai. Её уже окрестили «убийцей» Claude от Anthropic, и, как это часто бывает, хайфы здесь больше, чем реальных оснований. Давайте разберемся, что представляет собой эта модель и насколько она действительно опасна для лидеров рынка.
Что такое GLM-5.2 и в чем её главные козыри?
GLM-5.2 — это флагманская открытая модель, которая, по заявлениям разработчиков, заточена под выполнение длительных и сложных рабочих сессий. Ключевое отличие от предшественника GLM-5.1 — это стабильное контекстное окно на 1 миллион токенов (против 200 тысяч ранее). Это означает, что модель может удерживать в «поле зрения» огромный объем кода или текста без потери качества.
Основные характеристики, которые привлекли внимание:
- Контекст в 1 млн токенов, который не деградирует при сверхдлинных сессиях.
- Два уровня усиления рассуждений: High (баланс производительности и расхода токенов) и Max (максимум возможностей, но с высоким потреблением ресурсов).
- Открытая лицензия MIT без региональных ограничений, что позволяет запускать модель на собственном оборудовании (self-hosting).
- Цена API осталась на уровне предыдущей версии, что является важным фактором.
Модель доступна на HuggingFace и ModelScope, а также через подписку GLM Coding Plan, десктопный агент ZCode и даже среды Claude Code и OpenCode.
Бенчмарки: где GLM-5.2 сильна, а где слаба?
По собственным тестам Z.ai, GLM-5.2 признана сильнейшей открытой моделью на рынке. Однако до флагмана Anthropic — Claude Opus 4.8 — она в большинстве сценариев не дотягивает.
На стандартных тестах по программированию разрыв с GLM-5.1 заметный: 81,0 против 63,5 на Terminal-Bench 2.1 и 62,1 против 58,4 на SWE-bench Pro. При этом на Terminal-Bench 2.1 результат 81,0 вплотную подходит к Opus 4.8 (85,0) и обгоняет Gemini 3.1 Pro (74,0).
Таблица сравнения в режиме Max (ключевые тесты):
| Бенчмарк | GLM-5.2 | GLM-5.1 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
| SWE-bench Pro | 62,1 | 58,4 | 69,2 | 58,6 | 54,2 |
| Terminal-Bench 2.1 | 81,0 | 63,5 | 85,0 | 84,0 | 74,0 |
| NL2Repo | 48,9 | 42,7 | 69,7 | 50,7 | 33,4 |
| DeepSWE | 46,2 | 18,0 | 58,0 | 70,0 | 10,0 |
| ProgramBench | 63,7 | 50,9 | 71,9 | 70,8 | 39,5 |
| MCP-Atlas | 76,8 | 71,8 | 77,8 | 75,3 | 69,2 |
| Tool-Decathlon | 48,2 | 40,7 | 59,9 | 55,6 | 48,8 |
На длительных задачах (long-horizon) картина схожая. На тесте FrontierSWE GLM-5.2 отстает от Opus 4.8 всего на 1%, но обходит GPT-5.5 и предыдущую версию Opus 4.7. На PostTrainBench модель опережает Opus 4.7 и GPT-5.5, уступая лишь Opus 4.8. Однако на сверхдлинном SWE-Marathon отставание от Opus 4.8 составляет уже 13%.
Цена вопроса и реальные отзывы
Подписка GLM Coding Plan делится на три тарифа: Lite ($12,6/мес), Pro ($50,4/мес) и Max ($112/мес). Расход квоты зависит от нагрузки: коэффициент 3x в пиковые часы и 2x вне пика. До конца сентября действует акция, где внепиковое использование тарифицируется как 1x.
Пользователи разделились во мнениях. Сильные стороны: модель хвалят за лучшую базовую логику по сравнению с 5.1, сопоставимость с GPT-5.5 на высоком уровне рассуждений и способность автономно выполнять сложные задачи. Однако критикуют за слабую облачную инфраструктуру, высокий расход токенов в режиме Max и склонность застревать в бесконечных циклах. Многие отмечают, что модель раскрывается только в режиме Max, который сжигает ресурсы в разы больше, чем High.
Итог: убийца или нет?
Однозначного ответа нет. GLM-5.2 — это лучшая открытая модель на сегодня для программирования и автономных задач. В отдельных сценариях она вплотную приближается к флагману Anthropic. Открытая лицензия MIT, запуск на собственном оборудовании и низкий порог входа делают её заметным игроком.
Мое профессиональное мнение: называть GLM-5.2 «убийцей» Claude — это скорее маркетинговый ход, чем реальность. По большинству тестов Z.ai сама ставит свою модель ниже Opus 4.8. Более того, пользователи жалуются на нестабильную инфраструктуру и высокий расход токенов. Модель сокращает разрыв с лидерами, но пока не обгоняет их. Для энтузиастов и разработчиков, которым нужна мощная открытая модель, это отличный выбор. Но для тех, кто ищет стабильность и предсказуемость, Claude или GPT остаются более надёжными вариантами.