关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者264人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郭宇欣刘萧旭太原盛典现场互动 太甜了

生性洒脱 浏览 397

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 1521

黑灯工厂+35%毛利率,国潮IP玩具厂商递表港股,高瓴砸2.35亿元!|港E声

时代周报 浏览 1986

这年头长得好看也成错了?!

伊周潮流 浏览 154

阿信演唱会摔下舞台,相信音乐发声报平安:结束后有专业人员检查

扒虾侃娱 浏览 279

张柏芝某宝购物带到澳洲,谢振轩提一要求引热议

念得小柔 浏览 235

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

网易汽车 浏览 248

广汽“星源增程”正式发布,昊铂HL增程版26.98万起上市交付

新周刊 浏览 536

媒体:美以对伊朗战争持续不了太久 G7成员们也受不了

新民周刊 浏览 166

最时髦的单品,难道不是背肌吗?

时尚COSMO 浏览 285

白人女子被美国特工当街射杀 死前对峙说"我不生你气"

环球网资讯 浏览 272

首败!76人无缘24分逆转1分惜败绿军 恩比德丢绝杀布朗32+6

醉卧浮生 浏览 321

E句话| 王星与女友合体,复盘在缅甸遭遇?

仙女事件簿 浏览 287

抢不到票、退不了款,演唱会的锅该不该大麦背?

定焦One 浏览 697

每秒赚2300元!宁德时代交出最强年报

车东西 浏览 157

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 594

为年轻用户打造Dream Car,零跑推出纯电掀背轿跑

Report汽车 浏览 327

威斯康星大学突破性发现:AI模型的"视觉盲点"之谜终于有了答案

科技行者 浏览 377

用图片来存储记忆,AI助手可以更聪明地处理长对话了

科技行者 浏览 224

放不下身段就别扮丑,张嘉益告诉你,什么叫敬业不糊弄观众

娱乐圈笔娱君 浏览 14

携程迎来监管风暴

华尔街见闻官方 浏览 245
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4