关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者154人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

队报:消息人士称罗塞尼尔并不在切尔西新帅候选名单上

懂球帝 浏览 170

22点至8点严禁催收、电话最多6次/天,消费贷催收新规划重点

上观新闻 浏览 692

女演员被前夫指责害死公公 本人称愿接受刑事立案调查

极目新闻 浏览 379

瀚森真实命中率联盟垫底!断层落后倒数第二 投篮能力需大幅提升

罗说NBA 浏览 180

新增车道级导航与全向记录仪 腾势N9迎重磅OTA升级

网易汽车 浏览 332

小李子携27岁意大利女友首次亮相奥斯卡颁奖礼

时光在作祟 浏览 62

与AI机器人同行,中山万人徒步共迎新年

南方都市报 浏览 171

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

红星新闻 浏览 135

俄代表:美国侵略委内瑞拉意味着"无法无天时代的回归"

环球网 浏览 173

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 273

存储芯片涨价潮蔓延,半导体细分龙头业绩“水涨船高”

览富财经网 浏览 832

苏亚雷斯谈哲凯赖什:他很优秀,但是还得沉淀一下

懂球帝 浏览 334

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 163

朱广权喊风神放手一搏,风神L8限时置换价11.39万元起

网易汽车 浏览 349

2700亿大牛股定增落地

中国基金报 浏览 2021

咬定6000万!图片报:药厂立场明确,枪手想签因卡皮耶就掏解约金

直播吧 浏览 382

热刺遭遇穆罕默德·库杜斯新的伤病挫折

绿茵情报局 浏览 13

首发搭Momenta最强模型 上汽大众ID.ERA 9X突围9系红海

上海汽车报 浏览 68

哈马斯同意调解方提出的新加沙停火提议

新华社 浏览 361

浙江男子全款买车合同签完提不了车 4S店:经理进去了

FM93浙江交通之声 浏览 294

媒体:泽连斯基离间 声称俄罗斯正向中方放弃部分主权

澎湃新闻 浏览 223
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4