关闭广告

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

新智元651人阅读

新智元报道

编辑：定慧

【新智元导读】OpenAI在SWE-bench Verified编程测试中仅完成477道题却公布74.9%高分，对比之下，Anthropic的Claude完成全部500题。

几天前，OpenAI发布会上，奥特曼宣布GPT-5登顶了，号称代码能力全球第一。

但发布会上搞了一个大乌龙，52.8＞69.1=30.8？

于是，OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界（左边）。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

特朗普威胁＂对向伊朗供武国征收50%关税＂外交部回应

界面新闻浏览 234

博主：国安今天上午进行出征前最后一练，新任青训总监现身

懂球帝浏览 562

泰晤士：拜仁也对加纳乔感兴趣，但球员只想加盟切尔西

懂球帝浏览 589

西媒：索莱尔将在关窗前离开巴黎，马竞和皇社对其感兴趣

懂球帝浏览 611

马杜罗不认罪称＂被绑架＂＂仍是总统＂外交部回应

环球网资讯浏览 397

苹果iPhone17发布前夜，深圳华强北抢先上市手机壳，郑州富士康员工：每天都在加班

时代财经浏览 650

伊姐周六热推：电视剧《树影迷宫》；电视剧《锦月令》......

伊周潮流浏览 421

涉疫邮轮感染病例増至8人已有3人病逝邮轮曾去过南极

极目新闻浏览 190

中国游客称在瑞士看到峨眉山石官方证实：已落户10年

封面新闻浏览 451

限时售价6.58万起全新MG4成都车展正式上市

网易汽车浏览 619

男生最讨厌的4种女生发型！

Yuki女人故事浏览 499

ChatGPT跟进阿福，AI健康按下快进键

海克财经浏览 1281

恩里克：0-0通常让人觉得比赛沉闷，但今天完全不是这样

懂球帝浏览 421

最牛退休女工，靠卖易拉罐，纳税100亿

创业家浏览 1758

塞纳河“上岸”不易：20年合约、赔350万成为失信人、抑郁症也要赔钱…小偶像们那些年打过的官司

仙女事件簿浏览 428

蔚来ES9压轴登场，“9系”五强争霸：谁是中国豪华新能源的终极答案?｜汽车观察

封面新闻浏览 238

一农商行员工骗贷1600万，曾任某支行行长，以农村残疾困难户名义贷出上百万

新京报浏览 4768

苹果M4款iPad Air亮相，3月11日开启发售！

IT之家浏览 303

安东尼·戈登转会巴萨的经济账分析

绿茵情报局浏览 153

格陵兰岛称选择丹麦和欧盟已准备好迎接更大规模军事存在

国际在线浏览 351

23分钟11中10轰21+8！王哲林打出赛季最强一战上海八连胜稳头名

颜小白的篮球梦浏览 440

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

纪录片《重返...

巴列卡诺在欧...

可折叠iPh...

相同的3nm...

中超3队集体...

贵州茅台的盈...

米体：罗马想冬窗租借齐尔克泽，若晋级欧冠会自动触发买断

连续被血洗！今年前十个月的涨幅，币圈一个月跌完了

2025款奔驰GLB 220典藏版上市售价34.99万

特朗普威胁＂对向伊朗供武国征收50%关税＂外交部回应

博主：国安今天上午进行出征前最后一练，新任青训总监现身

泰晤士：拜仁也对加纳乔感兴趣，但球员只想加盟切尔西

西媒：索莱尔将在关窗前离开巴黎，马竞和皇社对其感兴趣

马杜罗不认罪称＂被绑架＂＂仍是总统＂外交部回应

苹果iPhone17发布前夜，深圳华强北抢先上市手机壳，郑州富士康员工：每天都在加班

伊姐周六热推：电视剧《树影迷宫》；电视剧《锦月令》......

涉疫邮轮感染病例増至8人已有3人病逝邮轮曾去过南极

中国游客称在瑞士看到峨眉山石官方证实：已落户10年

限时售价6.58万起全新MG4成都车展正式上市

男生最讨厌的4种女生发型！

ChatGPT跟进阿福，AI健康按下快进键

恩里克：0-0通常让人觉得比赛沉闷，但今天完全不是这样

最牛退休女工，靠卖易拉罐，纳税100亿

塞纳河“上岸”不易：20年合约、赔350万成为失信人、抑郁症也要赔钱…小偶像们那些年打过的官司

蔚来ES9压轴登场，“9系”五强争霸：谁是中国豪华新能源的终极答案?｜汽车观察

一农商行员工骗贷1600万，曾任某支行行长，以农村残疾困难户名义贷出上百万

苹果M4款iPad Air亮相，3月11日开启发售！

安东尼·戈登转会巴萨的经济账分析

格陵兰岛称选择丹麦和欧盟已准备好迎接更大规模军事存在

23分钟11中10轰21+8！王哲林打出赛季最强一战上海八连胜稳头名

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

纪录片《重返...

巴列卡诺在欧...

可折叠iPh...

相同的3nm...

中超3队集体...

贵州茅台的盈...

米体：罗马想冬窗租借齐尔克泽，若晋级欧冠会自动触发买断

连续被血洗！今年前十个月的涨幅，币圈一个月跌完了

2025款奔驰GLB 220典藏版上市 售价34.99万

特朗普威胁＂对向伊朗供武国征收50%关税＂ 外交部回应

博主：国安今天上午进行出征前最后一练，新任青训总监现身

泰晤士：拜仁也对加纳乔感兴趣，但球员只想加盟切尔西

西媒：索莱尔将在关窗前离开巴黎，马竞和皇社对其感兴趣

马杜罗不认罪称＂被绑架＂＂仍是总统＂ 外交部回应

苹果iPhone17发布前夜，深圳华强北抢先上市手机壳，郑州富士康员工：每天都在加班

伊姐周六热推：电视剧《树影迷宫》；电视剧《锦月令》......

涉疫邮轮感染病例増至8人已有3人病逝 邮轮曾去过南极

中国游客称在瑞士看到峨眉山石 官方证实：已落户10年

限时售价6.58万起 全新MG4成都车展正式上市

男生最讨厌的4种女生发型！

ChatGPT跟进阿福，AI健康按下快进键

恩里克：0-0通常让人觉得比赛沉闷，但今天完全不是这样

最牛退休女工，靠卖易拉罐，纳税100亿

塞纳河“上岸”不易：20年合约、赔350万成为失信人、抑郁症也要赔钱…小偶像们那些年打过的官司

蔚来ES9压轴登场，“9系”五强争霸：谁是中国豪华新能源的终极答案?｜汽车观察

一农商行员工骗贷1600万，曾任某支行行长，以农村残疾困难户名义贷出上百万

苹果M4款iPad Air亮相，3月11日开启发售！

安东尼·戈登转会巴萨的经济账分析

格陵兰岛称选择丹麦和欧盟 已准备好迎接更大规模军事存在

23分钟11中10轰21+8！王哲林打出赛季最强一战 上海八连胜稳头名

2025款奔驰GLB 220典藏版上市售价34.99万

特朗普威胁＂对向伊朗供武国征收50%关税＂外交部回应

马杜罗不认罪称＂被绑架＂＂仍是总统＂外交部回应

涉疫邮轮感染病例増至8人已有3人病逝邮轮曾去过南极

中国游客称在瑞士看到峨眉山石官方证实：已落户10年

限时售价6.58万起全新MG4成都车展正式上市

格陵兰岛称选择丹麦和欧盟已准备好迎接更大规模军事存在

23分钟11中10轰21+8！王哲林打出赛季最强一战上海八连胜稳头名