关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者131人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商务部公告附件首次改为wps格式 此前多为doc或pdf

上游新闻 浏览 305

马哈德迈连续两轮吹中超,他曾执法国足金色三分钟绝杀巴林

懂球帝 浏览 386

“科技界春晚”启幕,今年的CES有哪些故事?

国际金融报 浏览 1982

大型SUV“搅局者”:奇瑞风云T11叫板头部玩家

一品汽车 浏览 248

今年秋天最流行的4件卫衣,减龄又时髦!

LinkFashion 浏览 367

刚输英乙队!卫报:曼联有人质疑阿莫林,认为成绩没起色可能辞职

直播吧 浏览 392

万科的“至暗时刻”

翠鸟资本 浏览 1700

父子除夕夜放烟花引火灾致1死1伤 父亲被判7年赔270万

红星新闻 浏览 470

又一国产车企官宣:正式全面停产、停售燃油车!

电动知家 浏览 136

"上海第一黄鱼面馆"塌房 当着执法队员面使用过期香干

潇湘晨报 浏览 177

伊朗:驱逐美以大使可自由通过霍尔木兹海峡

界面新闻 浏览 64

冰雪穿越理念 宾利添越Concept X官图发布

车质网 浏览 142

俞浩摸着雷军过河

蓝鲸新闻 浏览 439

美国正式退出世卫组织 还欠费2.6亿美元

都市快报橙柿互动 浏览 157

两死者死于家中非交通事故 定损员伙同他人骗保120万

红星新闻 浏览 267

时间序列也会"说话"?这个突破性AI让数据图表变成了智能分析师

科技行者 浏览 180

价格没变升级5G网?2026款宝马X1上市,销量稳了?

大李说车 浏览 147

应聘者被骂「吃的不如狗」?格力回应;市占率存疑?影石回应市占率下滑及大疆价格战;零跑汽车辟谣将被一汽集团收购:消息不实丨雷峰早报

雷峰网 浏览 246

俄称对乌实施大规模打击

极目新闻 浏览 181

破局“影子AI”!神州控股科捷小金Agent,打造行业供应链专家

野马财经 浏览 301

重大突破!新能源,两大利好!

券商中国 浏览 16902
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4