关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者225人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

录像厅老板和幼女被杀妻子遭强奸 3名凶手被核准死刑

红星新闻 浏览 544

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 340

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 281

撒贝宁亲妹39岁未婚引热议:颜值远超嫂子,不婚是清醒还是无奈?

娱乐白名单 浏览 716

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 291

黄仁勋这波杀疯了 NVIDIA RTX Spark首测跑分:碾压苹果M5 54%!

快科技 浏览 35

何时结束战事 美以不同调:一个急于退场一个还想硬刚

环球网资讯 浏览 181

联盟各队在恐慌雷霆 战绩第一还手握快船2026年首轮签

仰卧撑FTUer 浏览 304

香港火灾初步调查结果:贴在窗户上的发泡胶板高度易燃

南方都市报 浏览 317

年度最扎心电影,看得中年男女坐立难安

Yuki女人故事 浏览 255

王晶谈蔡少芬演《甄嬛传》:一直在消耗情怀

联友军事 浏览 526

3家“通达系”A股快递公司9月单价均同比上涨,快递反内卷见成效

红星资本局 浏览 806

强一股份IPO:始终稳居首位的大客户,未来是否还能带来丰厚利润

览富财经网 浏览 1353

女人年纪大了怎么穿?衣选长、鞋带跟,会叠穿,优雅有范儿

静儿时尚达人 浏览 297

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

机器之心Pro 浏览 418

与OPPO并肩、以半固态破局:全新MG4的冷静突围

网易汽车 浏览 491

18.99万起,智享大六座旗舰SUV风云T11上市,又要卖爆?

电车通 浏览 365

纳帅:特尔施特根是否在豪门不是关键,重要的是他要上场比赛

懂球帝 浏览 322

利空突袭!暴跌50%!

券商中国 浏览 2859

这娱乐圈顶级渣男,居然翻身了

独立鱼 浏览 307

有4S店0成交,购置税新政实施6天,哪些车依然好卖?

路咖汽车 浏览 265
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4