关闭广告

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者87人阅读


当我们人类想学一项新技能时,最常见的方法就是看别人怎么做——看视频教程、观察师傅操作,然后模仿着练习。斯坦福大学的研究团队在2024年12月发表的一项研究中,成功地让机器人也掌握了这种"看视频学本领"的能力。这项名为"Dream2Flow"的研究由斯坦福大学的Karthik Dharmarajan、Wenlong Huang、Jiajun Wu、Li Fei-Fei和Ruohan Zhang等学者联合完成,论文编号为arXiv:2512.24766v1。

这个研究解决了一个令人头疼的问题:如何让机器人理解并执行那些看似简单的日常任务。比如说,当你告诉机器人"把面包放进碗里"时,它需要理解什么是面包、什么是碗,更重要的是要知道怎样抓取、移动和放置这些物品。传统的方法需要程序员为每个动作写出详细的指令,就像给机器人编写一本超级详细的操作手册。但现实世界太复杂了,物品的形状、位置、重量都千变万化,写不完的手册根本无法涵盖所有情况。

研究团队想到了一个巧妙的办法:既然现在的AI视频生成技术已经能够根据文字描述生成非常逼真的视频,那何不让机器人先"看"一段展示如何完成任务的视频,然后从中学习物体应该如何移动?这就好比你

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马杜罗:美国对委内瑞拉威胁是"老调重弹"

国际在线 浏览 166

喜报!识局助力落户在湖北麻城的食品制造项目已正式动工!

识局 浏览 1997

媒体:出轨女生拟被开除 传播视频另一方岂能逍遥法外

极目新闻 浏览 470

范雨林:实力硬汉却不红,娶普通人低调过日子

失宠的小野猪 浏览 106

对话Memories.ai:“人的记忆本质上是视觉,AI也该如此”

硅星人 浏览 178

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 176

“装了周杰伦”的机器狗?巨星传奇把6000台卖给了谁?

野马财经 浏览 1183

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 188

2号种子险爆冷!张本智和打满5局逆转日本悍将,8强战约战勒布伦

乒谈 浏览 226

纳斯达克中国金龙指数跌0.4%

证券时报 浏览 82

媒体人:与白鸥大学交手后 有清华男篮队员收到B联赛经纪人邀约

直播吧 浏览 349

D系列首款产品 零跑D19将于12月28日上市

车质网 浏览 117

46岁秦岚大孤山祈福被偶遇,素颜白皙少女感

热点风采 浏览 105

Manus最新爆料:公司收入运行率达9000万美元

网易科技报道 浏览 290

加沙停火协议生效后的48小时:人质将释放、民众返乡

澎湃新闻 浏览 232

仅10%援助卡车获准进入 加沙地带饥荒危机加剧

极目新闻 浏览 223

外观内饰优化 新款现代Staria将于明年上市

车质网 浏览 122

高市早苗曾叫嚣台湾有事日本必入

极目新闻 浏览 199

小米REDMI Turbo 5 Max手机“续航耐力赛”直播战报出炉

IT之家 浏览 68

科学家开发“神经蠕虫”,实现颅内电极游走模式

DeepTech深科技 浏览 278

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 1063
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4