国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力
|
继国产大模型Seedance刷屏后,本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线,其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。该模型在OpenRouter登顶热度榜首,在代理式编程单项实测中超越Claude Opus位列全球第一;而在官方确认身份前,Pony Alpha已直接驱动相关公司股价连续两日大幅上涨,成为港股AI板块最强催化。 2月12日,Artificial Analysis Intelligence Index v4.0发布。在纳入397个模型、10项专业评测的权威榜单中,GLM-5以50分综合成绩并列全球第三,仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5,成为全球排名最靠前的国产模型之一。 2026年2月11日,智谱AI正式发布新一代旗舰大模型GLM-5,此前以匿名代号“Pony Alpha”在海外OpenRouter平台引爆技术圈,海外热议“最强开源代码模型”“推理深度与工程化能力逼近闭源顶级水准”。当前硅谷大模型风向已全面转向Agentic Coding,GPT-5.3-Codex、Claude Opus 4.6均聚焦长时程、高复杂度工程任务,如编译内核、重构代码库、批量解决GitHub issue。GLM-5是国内首个跟上这一前沿趋势的模型,实现从“对话式代码生成”到“端到端系统工程”的突破。 实测显示,GLM-5具备顶尖工程能力:构建高并发电商库存系统时,不仅输出精美UI,更自主设计Redis缓存、消息队列、数据库锁,代码可直接上线运行;处理复杂开源项目报错日志时,可规划排查路径、分析依赖树并输出修复补丁,且完全开源。在专业评测上,GLM-5拿下SWE-bench Verified 77.8分(逼近Opus 4.6的80.9分)、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠,Coding与Agent能力达到开源SOTA。GLM-5采用MoE稀疏架构,擅长长程Agent任务与复杂系统设计,可支撑数百次工具调用、长程记忆与复杂指令执行。 |
在线投稿
-
相关阅读
-
代斯对战温峥嵘,观众质疑黑幕,现场一片哗然!
-
新乡南太行一私家车坠崖悲剧发生,2人遇难引关注
-
数千年炼铁技艺革新,中国高炉成功出铁
-
女子走失25年,腹中竟藏90斤巨瘤,揭开尘封的惊人真相!
-
代斯热舞瞬间,尽显女团风采,网友,这股女团味太上头了!
-
伊朗启动真实承诺4第92波打击,军事行动背后的战略意图解析
-
苹果第8号员工坚守岗位至今,揭秘他与乔布斯共度的传奇岁月
-
乘风2026初舞台排名揭晓,阚清子勇夺第一,实力惊艳众人
-
精彩图片
-
严重污染!印度首都河面漂浮大量有毒泡沫
-
金饰价格突破800元/克大关
-
绝美!北京朝霞遇到平流雾
-
美国给以色列派先遣队,援助的“萨德”也将启用?
-
以总理住宅遭无人机袭击 以方反应强烈
-
美政府紧急调查以色列报复伊朗计划外泄事件
-
以军袭击加沙地带北部拜特拉希亚地区已致73人死亡
-
加沙民众:每时每刻都有屠杀发生 我们已是活死人
-
新帖速递
-
代斯对战温峥嵘,观众质疑黑幕,现场一片哗然!
-
新乡南太行一私家车坠崖悲剧发生,2人遇难引关注
-
数千年炼铁技艺革新,中国高炉成功出铁
-
女子走失25年,腹中竟藏90斤巨瘤,揭开尘封的惊人真相!
-
代斯热舞瞬间,尽显女团风采,网友,这股女团味太上头了!
-
伊朗启动真实承诺4第92波打击,军事行动背后的战略意图解析
-
苹果第8号员工坚守岗位至今,揭秘他与乔布斯共度的传奇岁月
-
乘风2026初舞台排名揭晓,阚清子勇夺第一,实力惊艳众人

精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论