关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者224人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 307

媒体:泽连斯基妥协 刚冻结俄资产的欧洲"惊觉一场空"

上观新闻 浏览 252

美股开盘三大指数涨跌不一 英伟达跌近2%

证券时报 浏览 273

聚焦“全球视野下的人工智能”,欧美同学会留英分会首期人工智能创新沙龙召开

上观新闻 浏览 294

泽连斯基会晤北约秘书长 要求提供真正有效安全保障

新京报 浏览 484

i茅台1499元直销飞天茅台“秒空”,每5分钟补货仍遭疯抢

红星资本局 浏览 2500

中佛罗里达大学破解仿真优化难题:让计算机在噪声中找到最优解

科技行者 浏览 295

削减三成募资终迎上会审核之机,精创电气闯关北交所上市能否如愿

叩叩财讯 浏览 874

鲁尼:恩里克是顶级教头,5-2领先还在大举压上争取更多进球

懂球帝 浏览 88

法尔克:水晶宫确实非常难对付,如果能保持零封就更完美了

懂球帝 浏览 289

海哈金喜力挺嫣然医院:为李亚鹏点赞,多年笨拙的坚持很不容易

扒虾侃娱 浏览 240

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 338

销量连跌5年?洋品牌无奈关闭100家门店,专家:中国人不买了

木禾投研 浏览 547

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 5579

来酷AI MINI PRO迷你主机上架:"Lunar Lake"平台,3799元起

IT之家 浏览 110

政务大模型部署,重磅文件印发

智东西 浏览 390

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

环球网资讯 浏览 39

奥迪A6L e-tron四驱版公布 双电机爆发405 kW

网易汽车 浏览 391

“大衣+毛衣”今年冬天又火了,这样穿时髦又高级!

LinkFashion 浏览 313

亏了1800万,分红1.3个亿!网红牙膏,凭啥上市?

蓝鲸新闻 浏览 105

乐高乐园是伪装成迪士尼的少年宫

有数DataVision 浏览 1025
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4