关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者226人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

又一个汽车新品牌要来了,背靠五菱,首款车型微型车

汽车公告板 浏览 403

戴向宇曾单方面通知家人要和陈紫函离婚

乡野小珥 浏览 443

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 1322

年度焦点!这是你从没见过的独特电影创作

幕味儿 浏览 280

万胜智能:累计在手订单超12亿元,新能源汽车领域获重大突破

览富财经网 浏览 1506

卢浮宫一件被盗文物被发现已损毁 疑为欧仁妮皇后皇冠

极目新闻 浏览 396

年末避险情绪抬升 公募选股遵循涨价硬逻辑

证券时报 浏览 7424

美股,涨爆了!A股,怎么走?

金石随笔 浏览 2510

如鱼得水!福克斯半场10中5得13分5板4助1断1帽 得分暂全队最高

直播吧 浏览 615

公募FOF重回景气

证券市场周刊 浏览 11396

夏天可以准备一件橘色、黄色单品,好搭不挑身材,利用率很高

静儿时尚达人 浏览 27

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 436

美国政府未偿国债首次突破30万亿美元,自2018年以来翻一番

华尔街见闻官方 浏览 5582

若看懂英伟达,5年前愿意用茅台换!段永平持仓曝光:猛砍英伟达

金石随笔 浏览 7238

《狙击蝴蝶》开播!看完4集,我想说:都市爱情剧就该这么拍!

娱乐圈笔娱君 浏览 339

泽连斯基会晤北约秘书长 要求提供真正有效安全保障

新京报 浏览 488

采用增程动力 极石ADAMAS将于12月17日上市

车质网 浏览 296

一路繁花2:刘嘉玲夸王家卫,何赛飞装都不装了

娱乐圈笔娱君 浏览 353

充电5分钟就能补400公里,为什么节假日还要排队充电?

吴佩频道 浏览 369

内容玩+ AI创未来:一场关于爆款的行业对话

网易汽车 浏览 438

以军称已打死哈马斯新任军事领导人

财联社 浏览 25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4