可可资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

泽连斯基称将...

吊打比亚迪、...

韩磊被疑出轨...

张艺兴单依纯...

塞内加尔一度...

越涨越卖？英...

大礼包？蓉城海港送对手亚冠首胜！上海双雄成唯二0胜队+包揽倒2

看了《沉默的荣耀》就明白：于和伟的班，娱乐圈没有人接得了

看完10集《太平年》，我头皮发麻，终于有人把“牵羊礼”拍出来了

成熟企业做新品牌往往很难成功，为什么？

公司倒查半年考勤辞退迟到32次员工员工起诉法院判了

上身基础，下身就不基础

钱志敏突然当庭认罪震动旁听席刑期或减免三分之一

北约名存实亡！美警告欧洲，不要指望美军保护

希金斯晋级斯诺克北爱赛八强

毒枭留下的80头河马被捕杀前获救亚洲富豪：我全要了

票房炸裂，口碑崩塌，《731》到底值不值得我们为它买单

像颜如晶这样坚持，做什么都会成功吧！

齐溪晒二胎宝宝正脸！身材发福明显

短剧翻拍《新英雄本色》，刘萧旭主演?

多给2分钟来背锅？大帝25分钟20+6丢绝杀马克西才该为失利担责

与黄晓明离婚后，杨颖背后的男人是有妻女的他

卫衣+半裙=早春王炸穿搭！显瘦又时髦，照着穿太美了！

小马智行第七代 Robotaxi 完成吐鲁番夏测

伊姐周六热推：电影《再见，坏蛋》；电视剧《定风波》......

普京和泽连斯基是否可能在北京会晤中方回应

花一个月工资买节日礼物，值吗？

三战全胜，巴列卡诺主帅伊尼戈-佩雷斯当选西甲10月最佳教练

李嘉欣：从＂富豪狙击手＂到豪门贤妻，她的人生比电影更精彩！

靠脱口秀昙花一现的李诞，如今越混越落魄了