GLM-5.2: Действительно ли эта китайская нейросеть — «убийца» Claude?
На просторах криптосообщества и ИИ-индустрии разгорелся новый ажиотаж. Новая модель GLM-5.2 от компании Z.ai позиционируется как прямой конкурент флагманских решений Anthropic. Энтузиасты уже окрестили ее «убийцей Claude», отмечая впечатляющие результаты в ряде сценариев при цене, которая в десять раз ниже. Давайте разберемся, насколько справедливы эти громкие заявления.
GLM-5.2 — это флагманская модель, оптимизированная для длительных рабочих сессий. Ее главное преимущество перед предшественницей GLM-5.1 — стабильное контекстное окно на 1 миллион токенов, что в пять раз больше предыдущих 200 тысяч. Это позволяет модели «удерживать в голове» целые кодовые базы и сложные проекты без потери качества.
Ключевые особенности новинки:
- Контекст 1 млн токенов, не деградирующий при сверхдлинных сессиях.
- Два уровня усиления рассуждений: High для баланса производительности и расхода токенов, и Max для максимальной мощности.
- Открытая лицензия MIT без региональных ограничений, позволяющая запускать модель на собственном оборудовании (self-hosting).
- Цена API, оставшаяся на уровне предыдущей версии GLM-5.1.
Бенчмарки: реальные цифры против маркетинга
По собственным тестам Z.ai, GLM-5.2 признана сильнейшей открытой моделью на рынке. Однако до флагмана Anthropic — Claude Opus 4.8 — она в большинстве случаев не дотягивает. Разрыв с GLM-5.1 заметен: 81,0 против 63,5 на Terminal-Bench 2.1 и 62,1 против 58,4 на SWE-bench Pro. На Terminal-Bench 2.1 результат 81,0 вплотную подходит к Opus 4.8 (85,0) и обгоняет Gemini 3.1 Pro (74,0).
Сравнение в максимальном режиме рассуждения:
| Бенчмарк | GLM-5.2 | GLM-5.1 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
| SWE-bench Pro | 62,1 | 58,4 | 69,2 | 58,6 | 54,2 |
| Terminal-Bench 2.1 | 81,0 | 63,5 | 85,0 | 84,0 | 74,0 |
| NL2Repo | 48,9 | 42,7 | 69,7 | 50,7 | 33,4 |
| DeepSWE | 46,2 | 18,0 | 58,0 | 70,0 | 10,0 |
| ProgramBench | 63,7 | 50,9 | 71,9 | 70,8 | 39,5 |
| MCP-Atlas | 76,8 | 71,8 | 77,8 | 75,3 | 69,2 |
| Tool-Decathlon | 48,2 | 40,7 | 59,9 | 55,6 | 48,8 |
На длинных горизонтах (long-horizon tasks) картина схожая. На тесте FrontierSWE, где модель ведет открытые технические проекты десятками часов, GLM-5.2 отстает от Opus 4.8 всего на 1%, обходя GPT-5.5 и Opus 4.7. На PostTrainBench она также уступает лишь Opus 4.8. Однако на сверхдлинном SWE-Marathon с задачами вроде создания компиляторов отставание от Opus 4.8 достигает 13%. Тем не менее, GLM-5.2 показывает лучший результат среди всех открытых моделей.
Цена и подвохи
Подписка GLM Coding Plan делится на три тарифа: Lite ($12,6/мес), Pro ($50,4/мес) и Max ($112/мес). Внутри подписки расход квоты зависит от нагрузки: коэффициент 3x в часы пик и 2x вне пика. До конца сентября действует акция, где внепиковое использование тарифицируется как 1x.
Отзывы пользователей разделились. Сильные стороны: модель называют сильнейшей открытой нейросетью, ее базовая логика заметно лучше версии 5.1, а в программировании она сопоставима с GPT-5.5 на высоком уровне рассуждения. Однако критикуется облачная инфраструктура, слабая поддержка и высокая стоимость. Пользователи жалуются, что модель склонна застревать в бесконечных циклах и игнорировать команды. По их мнению, она заточена исключительно под бенчмарки.
Итог: убийца или нет?
Однозначного ответа нет. GLM-5.2 — лучшая на сегодня открытая модель для программирования и автономных задач. В отдельных длинных сценариях она вплотную подбирается к флагману Anthropic. Открытая лицензия MIT, запуск на собственном оборудовании и низкий порог входа делают ее заметным игроком.
Однако «убийцей» Claude новинку называют блогеры, а не бенчмарки. По большинству тестов Z.ai сама ставит свою модель ниже Opus 4.8. Пользователи жалуются на нестабильную облачную инфраструктуру, высокий расход токенов в режиме Max и слабую поддержку. Новая ИИ сокращает разрыв с лидерами, но пока не обгоняет их.
Мнение эксперта: GLM-5.2 — это впечатляющий шаг вперед для открытых моделей, особенно в контексте программирования. Однако называть ее «убийцей» Claude преждевременно. Реальная ценность модели раскроется, когда Z.ai решит проблемы с инфраструктурой и стабильностью. Пока что это отличный инструмент для энтузиастов и разработчиков, желающих запустить мощную ИИ-модель локально, но не замена для проверенных облачных решений.