关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者167人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

爱泼斯坦"自缢"后照片公开:脖子有血色勒痕

大风新闻 浏览 138

全新前脸/三种座椅布局可选 第三代豪越L内外饰曝光

网易汽车 浏览 249

38岁尹正再破天花板,这一次,他让整个娱乐圈“沉默”了

温柔娱公子 浏览 213

爱妻朱媛媛离世5月后,辛柏青又传来坏消息

阿废冷眼观察所 浏览 284

媒体:对用AI做“毁损图”申请退款,打击要更精准

澎湃新闻 浏览 363

芯片圈“大佬”IPO梦碎,牵出千万受贿案!

野马财经 浏览 949

纯度更高的致敬 尚界Z7预告图发布

网易汽车 浏览 172

美国微软公司:10月14日起Windows 10将“停服”

财闻 浏览 292

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 316

10岁抗癌小王子豪豪化疗17次后去世 爸爸:孩子解脱了

潇湘晨报 浏览 125

半导体封测第一股,进击汽车电子!

飞鲸投研 浏览 1034

米尔纳:我看到若塔做过那个庆祝动作,我可能模仿得不太好

懂球帝 浏览 384

车机升级 第五代宏光MINIEV将于3月下旬上市

车质网 浏览 62

董璇带小酒窝给朵朵庆生,陈思诚佟丽娅大方合照

爱吃冰棍的小痞子 浏览 123

辽宁舰正常演训 日本为何炒作所谓“雷达照射”问题

澎湃新闻 浏览 195

李鬼变李逵?央视揭开温峥嵘骗局真相

烈史 浏览 246

阿尔瓦拉多23投9中&三分15中7空砍25分3板3助3断 加时赛重伤退场

直播吧 浏览 330

盈利大考冲刺关头,千亿小鹏被指“虚假宣传”

雷达财经 浏览 178

该不该踢双前锋?哲科:我说多了教练要生气

懂球帝 浏览 291

买手机前必看!安兔兔1月性能排行更新:第一名甩开垫底近40万分

快科技 浏览 141

三幅字画涉刑被拍卖 其中徐悲鸿"奔马图"起拍价4762万

极目新闻 浏览 264
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4