关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者88人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

明略科技通过聆讯:上半年营收6.4亿,经调整利润转正 腾讯是股东

雷递 浏览 100

应聘者被骂「吃的不如狗」?格力回应;市占率存疑?影石回应市占率下滑及大疆价格战;零跑汽车辟谣将被一汽集团收购:消息不实丨雷峰早报

雷峰网 浏览 61

马斯克:推特将于本月晚些时候推出加密私信功能

界面新闻 浏览 10784

4大最新信号!出手“黄金坑”的机会来了?

小白读财经 浏览 1262

全美都在“抓爸爸”,8000多个特殊家庭破碎

浏览 412

《失孤》原型之子结婚:儿媳连喊3声爸 刘德华送来礼物

潇湘晨报 浏览 65447

韩媒吐槽中国球迷加油声太大是怎么回事?韩国人果然输不起

趣看热点 浏览 17029

Cariad不再是“灵魂”担当,大众请外援能否赌赢未来?

禾颜阅车 浏览 92

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 58

港股今年最大车企IPO要来了!赛力斯拟募资超130亿港元,基石投资者阵容豪华

时代周报 浏览 904

秋天第一件衬衫,试试这样穿!

黎贝卡的异想世界 浏览 227

贾玲电影新海报惹争议,大特写五官挤变形,过度贩卖焦虑被吐槽

萌神木木 浏览 4447

2023TVB颁奖礼后台更精彩:高海宁下跪,黄宗泽豪饮,陈豪热吻!

缘木不求娱 浏览 4401

沃克25+6绿军险胜快船3连胜 乔治32分塔图姆16中5

网易体育 浏览 18137

孙兴慜两连杀!争四大战独造3球,21场造21球,维拉真克星

奥拜尔 浏览 3493

“美好”新国际!齐沃战胜师父,蓝黑登顶意甲

体坛周报 浏览 75

李玟账号被异常登陆!最新解读

环球网资讯 浏览 92

雪佛兰新款电动皮卡暂不会采用特斯拉充电接口

网易科技报道 浏览 7551

夏天穿衣主打简约清爽 24套搭配舒服还减龄

七柒时尚笔记 浏览 7266

记者:库迪西亚把埃塞基耶尔卖给药厂最高可盈利2000万美元

懂球帝 浏览 203

VOGUE热捧刘亦菲被反噬,20周年众多大咖不出席,场面太尴尬!

萌神木木 浏览 94
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4