关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者127人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

解放军突然亮出大量东风17 竹林起竖画面被央视公开

小涛叨叨 浏览 170

合肥夜空上演“硬核”科技告白:1024架无人机点亮AI愿景

中安在线 浏览 252

2025年利润在4%徘徊,车圈是从从容容还是连滚带爬‌?

禾颜阅车 浏览 186

绿色+棕色、蓝色+棕色,这3组配色高级又好看!

LinkFashion 浏览 125

46岁秦岚大孤山祈福被偶遇,素颜白皙少女感

热点风采 浏览 145

军报批日本呼吁各国不参加九三阅兵:歪曲事实混淆视听

澎湃新闻 浏览 440

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

Yuki女人故事 浏览 89

全球首发:小米REDMI Note 15 Pro +手机搭载第四代骁龙7s处理器

IT之家 浏览 387

沪漂外国网红包丢了报警 警察到现场后发现"神秘字条"

新闻晨报 浏览 134

海廷加:奥斯梅恩和伊布、德罗巴一样强大,始终是一个威胁

懂球帝 浏览 234

哥伦比亚大学团队推出全球首个网络音视频文化理解基准

科技行者 浏览 141

亚布塞莱:我有冲劲斗志和侵略性 我的DNA与尼克斯完美契合

直播吧 浏览 359

沪媒:上海赛更达橘橙投资人朱骏将兑现400万元冲乙奖金

懂球帝 浏览 268

麻省理工学院发明“可注射”脑机芯片,有潜力用于治疗老年痴呆症

IT之家 浏览 197

包文婧产后做医美自曝没自信,不建议跟风

智凌纵横 浏览 378

杨瀚森防守时脚步过慢?美记:扎克-埃迪也慢 但杨比他技术更好

直播吧 浏览 421

世体:阿尔马达引发多家俱乐部争抢,本菲卡已对他表达兴趣

懂球帝 浏览 140

美国强掳马杜罗做法引发岛内担忧 国台办回应

北京日报客户端 浏览 133

特朗普称在考虑干预伊朗局势的强硬选项

新华社 浏览 139

媒体:特朗普得寸进尺 墨西哥女总统快扛不住了

澎湃新闻 浏览 360

背靠OpenAI的机器人初创1X亮相CES展示家务机器人,售价2万美元

华尔街见闻官方 浏览 638
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4