关闭广告

KAIST AI揭秘:让AI视频生成真正理解"谁对谁做了什么"的关键技术

科技行者249人阅读


当你看到一个AI生成的视频,画面中一个人正在递给另一个人一杯咖啡,你可能会觉得这很自然。但如果仔细观察,你会发现很多问题:咖啡杯可能突然消失了,递咖啡的人变成了两个人,或者咖啡杯莫名其妙地漂浮在空中。这些看似简单的交互场景,对AI来说却是极大的挑战。

来自韩国科学技术院(KAIST)AI实验室的研究团队,包括Siyoon Jin、Seongchan Kim、Dahyun Chung、Jaeho Lee、Hyunwook Choi、Jisu Nam、Jiyoung Kim和Seungryong Kim,在2025年10月发表了一项突破性研究。这项名为"MATRIX: Mask Track Alignment for Interaction-aware Video Generation"的研究,首次系统性地解决了AI视频生成中的交互理解问题。有兴趣深入了解的读者可以通过arXiv:2510.07310

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美CPI降温别高兴太早:经济学家怀疑政府关门导致数据失真,有人指明显出错

华尔街见闻官方 浏览 1722

知名博主喊话沈伯洋 用"吉林一号"公布其居住、工作地

澎湃新闻 浏览 152

晒"妈妈牌"耐克书包男子已收到耐克礼物 当事人发声

极目新闻 浏览 334

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 249

六人登记参选国民党主席 均已针对两岸关系表态

环球网资讯 浏览 300

全市场:加拉塔萨雷提出分三期支付奥斯梅恩转会费,总价7500万欧

直播吧 浏览 444

瑞信前副总裁挪用客户资金,判囚13年,24名高净值人士获赔8690万

财通社 浏览 788

网飞开年第一爆剧来了,快去看

独立鱼 浏览 126

夏末翻箱倒柜?其实靠一双鞋就能“一键换季”

黎贝卡的异想世界 浏览 374

伊朗防长:美国"以武促和"实为强制屈服 各国不会接受

极目新闻 浏览 311

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 271

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 288

保安打人赔35万结案13年后15人被公诉 被害人从未控告

澎湃新闻 浏览 314

“全球坚韧船队”成员控诉遭辱:以色列虐待所有人

看看新闻Knews 浏览 323

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木 浏览 245

补时绝平,曼联终结各项赛事对阵热刺四连败

懂球帝 浏览 219

7天票房2.3亿,差评满天飞的“大烂片”被捧上日冠,中国观众咋了

娱乐圈笔娱君 浏览 166

量子位「MEET2026智能未来大会」启动!年度榜单征集中

量子位 浏览 264

离婚6年,文章同样的“招数”,让她跌倒了两次?

趣文说娱 浏览 389

三件外套拍出17万美元天价!为什么时装精都想买她的同款?

黎贝卡的异想世界 浏览 75

礼来下调Zepbound减肥药现金价格,最低至每月299美元,股价下挫1%

华尔街见闻官方 浏览 2888
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4