关闭广告

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者376人阅读


这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过arXiv:2508.11598v1访问完整论文。

说起人类的听觉系统,那真是一个令人惊叹的生物工程奇迹。我们能够在嘈杂的咖啡厅里轻松分辨出朋友的声音,能够从语调中听出说话人的情绪变化,甚至能够在听到一个陌生单词时大致猜出它的含义。然而,让人工智能系统达到人类这样的听觉理解能力,却是一个让科学家们头疼了很久的难题。

传统的AI语音处理系统就像是一个只会机械记忆的学生,它们要么专注于完美地复制原始音频信号的每一个细节,要么依赖复杂的对比学习机制来区分不同的声音片段。这些方法虽然在某些特定任务上表现不错,但却缺乏人类

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

直辖市3位正厅被查 58岁政协秘书长年初刚履新

鲁中晨报 浏览 371

这样的“恶女”人设,真太爽了!

伊周潮流 浏览 213

李在明:韩美联合演习无意加剧半岛紧张局势

环球网资讯 浏览 432

微软OneDrive AI人脸识别功能引争议:每年仅允许用户关闭三次

IT之家 浏览 308

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 256

岚图卢放:打破百年成见 重构豪华轿车价值标准

网易汽车 浏览 144

悉尼枪案:男子勇夺一歹徒枪支 很多人活下来全靠他

红星新闻 浏览 198

聚焦第五届上海知识产权创新奖——中国科学院上海微系统与信息技术研究所成果转化处

上观新闻 浏览 263

卷首语 | 保卫复杂性:在被算法分裂的世界里留住清醒

时尚COSMO 浏览 403

AI里的明争暗斗:马斯克的甜言蜜语,和我们20%的胜率

一点财经 浏览 1277

E句话| 袁惟仁去世,前妻发长文送别

仙女事件簿 浏览 110

媒体:特朗普对韩关税提高至25% 韩国汽车业天塌了

澎湃新闻 浏览 134

U23国足遭暴击!鲍世蒙8分钟闪退,抢断王出场,媒体人:因祸得福

奥拜尔 浏览 151

卡罗拉锐放价格再下探!网友:这次真心动了

汽车网评 浏览 122

普京:俄罗斯对任何国家都不构成威胁

央视新闻客户端 浏览 211

OpenAI“星际之门”拉美首站:将在阿根廷建设 500MW AI 数据中心

IT之家 浏览 259

俄称控制乌居民点 乌称击落米-8直升机

环球网资讯 浏览 232

陌生人上门讨说法 18岁女孩独自在家起冲突被认定互殴

大风新闻 浏览 164

1200亿天价订单疑云:宁德时代为何押注一家“小公司”?

野马财经 浏览 1017

美航母大火持续超30小时后被扑灭 600多人无床可睡

环球网资讯 浏览 45

8.88万起售 还带8155芯片与L2辅助驾驶

My车轱辘 浏览 306
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4