关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者119人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 227

美财长批中国实施稀土出口管制是"对抗世界" 中方驳斥

环球网资讯 浏览 281

不长记性?李国庆又夸妻秀恩爱了

正经社 浏览 381

阿森纳:是巨大的错失机会还是宝贵的一分?唯有时间能证明

绿茵情报局 浏览 124

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 268

F1空气动力学下的超级跑车,阿斯顿·马丁Valhalla来袭

ams车评网 浏览 397

中方出手反制 日方"叫屈":向中方提出强烈抗议

澎湃新闻 浏览 142

黄一鸣才真清醒,大四怀孕不做“首富太太”

柠檬有娱乐 浏览 184

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 142

徐正源:以饱满斗志迎接挑战 会对阵容进行调整

体坛周报 浏览 298

E句话| 梁小龙去世,成龙周星驰发文悼念

仙女事件簿 浏览 142

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 261

港股涨18%,淘宝闪购的“理性”胜利

DT商业观察 浏览 12489

美股半导体板块,集体下跌

第一财经资讯 浏览 130

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者 浏览 106

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 284

安以恩:邦本宜裕是很“高级”的球员,我们能秒懂彼此的意图

懂球帝 浏览 203

澎湃读报丨央媒刊文追忆杨振宁先生:心系家国,功在世界

澎湃新闻 浏览 307

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 269

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄还显贵

静儿时尚达人 浏览 190

时尚守艺人 | 以木为纸,雕出万千世界

时尚COSMO 浏览 178
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4