关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者367人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

戴伟浚:我肯定憋着一股劲,要在深圳新鹏城证明自己

懂球帝 浏览 244

阿里涨超18%,芯片有“后备方案”

观察者网 浏览 477

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 246

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 196

科学家发现:AI用标点符号作为记忆密码

科技行者 浏览 491

天空体育:若利物浦向塞门约发出邀约,球员就会选择加盟

懂球帝 浏览 265

消费者兴趣低于预期 苹果“大幅”削减 iPhone Air 的产量

威锋网 浏览 402

新一轮货币宽松到来

泽平宏观展望 浏览 1935

以色列:随时重返战场

极目新闻 浏览 127

太强了!“宁王”净赚722亿元,分红361亿元,曾毓群能分到多少?

数字财经智库 浏览 4582

朱珠美上热搜的老钱风穿搭,太值得借鉴了!

LinkFashion 浏览 290

你的基础款,差一双Y3K银色球鞋

时尚COSMO 浏览 503

网红小英再曝猛料!上拉如出轨亲表妹

孤城落日 浏览 281

OpenAI周活跃用户突破4亿

环球网资讯 浏览 748

舒淇,东亚女孩的恨海情天

时尚COSMO 浏览 357

红旗E-QM5换电版车型正式上市 售8.98万元

车质网 浏览 352

超70亿独角兽“原地解散”,无人车赛道却将爆发?

虎嗅APP 浏览 5122

小米雷军回应被贴“营销大师”标签:营销不是坏事,但产品是基础

IT之家 浏览 243

丁威迪考虑去海外联赛淘金 拜仁和奥林匹亚科斯成为热门候选

仰卧撑FTUer 浏览 377

夏天穿衣有多种方式,这些穿搭让你收获搭配的灵感!舒适耐看

静儿时尚达人 浏览 573

从0比5巴西到2比0巴拉圭!韩国为自己正名

体坛周报 浏览 378
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4