关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者168人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

44岁的宋慧乔面相变了!她的变美思路普通人也可以借鉴

LinkFashion 浏览 208

AI 内容须亮明身份,《人工智能生成合成内容标识办法》明施行

IT之家 浏览 361

哈登:我以前从未如此不顺但我仍充满信心,这是对我们的考验

懂球帝 浏览 211

澳国防部称监测到中国舰队活动 外交部回应

财联社 浏览 213

阿尔瓦拉多23投9中&三分15中7空砍25分3板3助3断 加时赛重伤退场

直播吧 浏览 333

杰哈德指责加沙“和平委员会”组成服务于以方利益

极目新闻 浏览 155

古装黑马诞生!《子夜归》刚播热度破24000!观众集体真香预警

娱乐圈笔娱君 浏览 419

牛弹琴:2025年最勇敢的一个动作 背后是全世界的震惊

北京日报客户端 浏览 194

普京官邸遭91架乌无人机袭击 特朗普:我很生气

每日经济新闻 浏览 163

钟睒睒加码智能化,宗馥莉砍掉机器人公司到底损失有多大?

BT财经 浏览 16686

英伟达推出智驾AI大模型 马斯克泼“现实冷水”

网易汽车 浏览 162

冲刺第一股,中国最大独立模型厂商的成色、能力与野心

晚点LatePost 浏览 165

当智能体爆发在即,数据库如何成为“发动机”?

科技行者 浏览 118

美国父亲在家喝酒将2岁女儿留车内致身亡 入狱前自杀

红星新闻 浏览 272

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 314

孙怡董子健,离婚散场的恋爱脑总裁与明星娇妻

火姐娱乐trend 浏览 165

扎堆递表 智驾企业的进与困

北京商报 浏览 3763

东风集团将退市 岚图汽车将独立上市

网易汽车 浏览 360

年初至今股价涨超140%!诺诚健华上半年营收增74%

猛犸资本局 浏览 874

“天选古偶人”到如今 刘诗诗怎么了

汪茫的创业之路 浏览 383

日媒:中国呼吁公民暂缓赴日的措施 超出了日本预期

扬子晚报 浏览 234
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4