关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者145人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 229

科沃斯“最贵”的高管,又要套现3000万?

蓝鲸新闻 浏览 596

贾跃亭:FX Super One 车型在美国汉福德工厂试制顺利

IT之家 浏览 416

媒体:欧洲还是不敢动俄罗斯 哪怕普京正在恋爱中

新民晚报 浏览 203

刚刚!利好,直线暴涨!

中国基金报 浏览 140

美联储理事沃勒:CEO们称AI将致大量裁员,3月利率决议取决于2月劳动力数据

华尔街见闻官方 浏览 5926

美方公开核航弹测试画面

北京青年报 浏览 216

库克直播间带货 苹果换了打法

北京商报 浏览 308

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 215

视频:福建舰夜泊军港 航母上亮起灯光

北京日报 浏览 186

蓝宝科技呼吁 GPU 制造商放宽限制,赋予板卡设计更大自主权

环球网资讯 浏览 215

大空间 高质感 极狐T1让年轻人也能全都要

网易汽车 浏览 463

上汽大通MAXUS推出三款房车新品 限时售价11.98万元起

网易汽车 浏览 387

回归哈弗H序列 实拍哈弗H6L

太平洋汽车 浏览 285

内娱又增新赛道,叶祖新坐着就抢了主角的戏

最爱酷影视 浏览 175

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 1237

3件开心小事|| 这条视频竟然有一千万人看了

黎贝卡的异想世界 浏览 189

豆瓣9.1,宫崎骏大师动画神作最后告别放映!

幕味儿 浏览 285

女子网购雅鹿羽绒服衣袖上现"孝"字标 商家:补偿10元

都市报道 浏览 136

小马智行开通广州自动驾驶示范运营专线

环球网资讯 浏览 612

75岁谭咏麟街头买金鱼!与老板老友式寒暄

丁睋解说 浏览 158
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4