关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者67人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

清华团队破解:大模型训练崩溃之谜

科技行者 浏览 193

他被谢霆锋打成重伤,如今怎么样了?

卷史 浏览 219

1688发布诚信通AI版 将于今年10月上线

网易科技报道 浏览 296

队记:谢泼德肢体语言很糟糕 不想打球还不如早点换他下去

直播吧 浏览 445

衣服穿对不穿贵,这些才是最适合普通人的穿搭,优雅又简约

静儿时尚达人 浏览 158

2025生命科学大会在穗召开,发布器官医学十大进展

南方都市报 浏览 324

「好想来」与鸣鸣很忙,谁都成不了蜜雪冰城

36氪财经 浏览 1519

罗斯柴尔德家族现遗产之争:93岁婆婆与60岁儿媳打官司

红星新闻 浏览 118

网红抓银环蛇被咬伤疑因"嫌注射血清贵不打" 好友发声

潇湘晨报 浏览 222

不露腿也想穿好看,最关键的是这一点

黎贝卡的异想世界 浏览 75

琼瑶女神摘下假牙,撕碎的是流量滤镜

大龄女一晓彤 浏览 236

乌总统:美方28点计划已有所精简

每日经济新闻 浏览 172

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 160

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 1173

40+女人这样打扮:裙过膝,鞋有跟,才明白什么叫岁月不败美人

静儿时尚达人 浏览 363

杨振宁回国定居在清华园已超20年 为自家取名"归根居"

南方都市报 浏览 224

S家族,最出名的不是八卦?

江湖人称艾掌门 浏览 233

普京:俄罗斯将在战场解放本国故土 欧洲"猪猡"将下台

参考消息 浏览 105

范曾晚节不保?亲题牌匾下堆满烂鞋,还曾给释永信美女弟子题字

萌神木木 浏览 349

产品力全面提升 问界M7新老款车型对比

车质网 浏览 227

25万级大六座SUV 吉利银河M9 8月23日开启预售

网易汽车 浏览 354
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4