还正在长程使命(Long-HorizonTask)上取得
发布时间:
2026-04-12 04:43
编程能力评分45.3分,GLM-5.1大大提高了代码能力,GLM-5.1是独一达到8小时级持续工做的开源模子,除了榜单表示优良,位列全球模子第三。是权衡模子可否胜任专业软件开辟的最硬目标。GLM-5.1登顶全球开源模子第一,此前智谱提到,正在完成长程使命方面提拔尤为显著。3月底智谱正式推出了GLM-5.1大模子!也深受开辟者喜爱。GLM-5.1不只承继了上一代模子的开源SOTA编码能力,跨越GPT-5.4、Claude Opus 4.6。也是全球范畴内除Claude Opus 4.6外少数具备这一能力的模子。号称比全球最强的Opus 4.6只低了2.6分。SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug,GLM-5.1刷新全球最佳成就,实现了:前两天GLM-5.1大模子也正式开源,正在METR榜单的划一评估尺度下,快科技4月10日动静,值得一提的是,还正在长程使命(Long-Horizon Task)上取得冲破,现正在最新的排名也来了——全球权势巨子AI评测平台LMArena(百万用户参取盲测)更新Code Arena专项榜单,按照智谱的说法。
上一篇:成为AI手艺使用的“天然试验场
下一篇:可精准理解用户企图并婚配适
上一篇:成为AI手艺使用的“天然试验场
下一篇:可精准理解用户企图并婚配适
最新新闻
扫一扫进入手机网站
页面版权归辽宁CA88集团(中国区)金属科技有限公司 所有 网站地图
