关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者366人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI大厂搜索与全栈的赌局,百度比谷歌更激进

钛媒体APP 浏览 537

售14.98万 方程豹钛3推501km后驱Ultra版

网易汽车 浏览 365

扫街榜百日奇袭:高德正在成为AI时代的超级枢纽

光子星球 浏览 323

前海财险困守“C班”,女掌门霍建梅独掌危局?

经理人杂志 浏览 534

2026款岚图梦想家预售:首款后轮转向800V超混MPV,38.99万元起

IT之家 浏览 509

罗马诺:阿斯顿维拉除了接触拉芒,也向曼联询问了桑乔

懂球帝 浏览 469

看来看去还是这些穿搭最适合夏天,不沉闷、不显老,舒适减龄

静儿时尚达人 浏览 479

再次掀翻AI圈!Sora2面前,MiniMax的另类打法

南方都市报 浏览 339

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题

新智元 浏览 553

狼队主帅:斩获首胜之后我们不会松懈;小将马内踢得非常好

懂球帝 浏览 247

不管在什么地方 你都是那样拉轰的男人

星球商业评论 浏览 2217

特朗普被指一边喊一边咒骂 让乌方把顿巴斯地区给俄方

红星新闻 浏览 371

翁青雅被官媒点名,言辞直戳其肺管子

娱乐圈笔娱君 浏览 336

江俊晋级斯诺克苏格兰公开赛八强

体坛周报 浏览 232

豪赚200亿,河南矿王,迎接泼天富贵!

飞鲸投研 浏览 3879

急流勇退?赵丽颖一年多没进组,被传复婚带娃,38岁给自己放长假

萌神木木 浏览 84

租下公立医院后 原副县长非法集资近7亿直至“爆雷”

中国新闻周刊 浏览 465

58岁侯勇老来得子!携小20岁三婚妻子亮相澳门

阿纂看事 浏览 307

"特泽会"细节:白宫摆出一张地图

环球时报新闻 浏览 497

陕西夫妇在赞比亚遇害被发现 所雇当地员工有重大嫌疑

极目新闻 浏览 272

今年最流行的穿法:裤子+针织、裙子+针织,时髦又减龄!

LinkFashion 浏览 241
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4