国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

来源：网络 作者：声远热闻

阅读：1039

发布时间：2026-02-13 00:12:56

评论：0

[摘要] 继国产大模型Seedance刷屏后，本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线，其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。该模型在OpenRouter登顶热度榜首，在代理式编程单项实测中超越Claude Opus位列全球第一；而在官方确认身份前，Pony Alpha已直接驱动相关公司股价连续两日大幅上涨，成为港股AI板块最强催化。2月12日，Artifi

继国产大模型Seedance刷屏后，本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线，其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。该模型在OpenRouter登顶热度榜首，在代理式编程单项实测中超越Claude Opus位列全球第一；而在官方确认身份前，Pony Alpha已直接驱动相关公司股价连续两日大幅上涨，成为港股AI板块最强催化。

2月12日，Artificial Analysis Intelligence Index v4.0发布。在纳入397个模型、10项专业评测的权威榜单中，GLM-5以50分综合成绩并列全球第三，仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5，成为全球排名最靠前的国产模型之一。

2026年2月11日，智谱AI正式发布新一代旗舰大模型GLM-5，此前以匿名代号“Pony Alpha”在海外OpenRouter平台引爆技术圈，海外热议“最强开源代码模型”“推理深度与工程化能力逼近闭源顶级水准”。当前硅谷大模型风向已全面转向Agentic Coding，GPT-5.3-Codex、Claude Opus 4.6均聚焦长时程、高复杂度工程任务，如编译内核、重构代码库、批量解决GitHub issue。GLM-5是国内首个跟上这一前沿趋势的模型，实现从“对话式代码生成”到“端到端系统工程”的突破。

实测显示，GLM-5具备顶尖工程能力：构建高并发电商库存系统时，不仅输出精美UI，更自主设计Redis缓存、消息队列、数据库锁，代码可直接上线运行；处理复杂开源项目报错日志时，可规划排查路径、分析依赖树并输出修复补丁，且完全开源。在专业评测上，GLM-5拿下SWE-bench Verified 77.8分（逼近Opus 4.6的80.9分）、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠，Coding与Agent能力达到开源SOTA。GLM-5采用MoE稀疏架构，擅长长程Agent任务与复杂系统设计，可支撑数百次工具调用、长程记忆与复杂指令执行。

关键词：