关闭广告

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者385人阅读


这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过arXiv:2508.11598v1访问完整论文。

说起人类的听觉系统,那真是一个令人惊叹的生物工程奇迹。我们能够在嘈杂的咖啡厅里轻松分辨出朋友的声音,能够从语调中听出说话人的情绪变化,甚至能够在听到一个陌生单词时大致猜出它的含义。然而,让人工智能系统达到人类这样的听觉理解能力,却是一个让科学家们头疼了很久的难题。

传统的AI语音处理系统就像是一个只会机械记忆的学生,它们要么专注于完美地复制原始音频信号的每一个细节,要么依赖复杂的对比学习机制来区分不同的声音片段。这些方法虽然在某些特定任务上表现不错,但却缺乏人类

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

洪磊:参加九三纪念活动的外方嘉宾主要有三方面特点

上观新闻 浏览 444

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 229

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木 浏览 267

切费林:我认为球员在赛季结束后,至少应该有一个月假期

懂球帝 浏览 231

光线传媒:前三季度净利润同比增长407%

网易财经 浏览 1566

打破垄断,光模块巨头,利润大增300%!

飞鲸投研 浏览 1094

邱淑贞女儿沈月回应,称这辈子都没买过热搜,很欣赏张凌赫与沈月

扒虾侃娱 浏览 264

推广中奖名单-更新至2025年11月5日推广

黎贝卡的异想世界 浏览 215

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 262

鸿蒙智行L3,从架构革命到出行方式重构

汽车公社 浏览 189

英伟达CEO黄仁勋:“上帝级AI”还很遥远,但世界仍需向前发展

IT之家 浏览 139

纪念戴安基顿,伍迪艾伦最高杰作告别放映❤️

幕味儿 浏览 157

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

红星新闻 浏览 131

伊姐周日热推:访谈《陈鲁豫·漫谈》;电视剧《目之所及》......

伊周潮流 浏览 590

宗馥莉因遗产被起诉?娃哈哈:家族内部事务与公司业务无关联

YOUNG财经 浏览 21038

3张照片背后,娱乐圈正在悄悄改变的一件事

传递满满正能量 浏览 154

男子带病妻从湖南徒步3000公里去西藏 被指花钱找苦吃

红星新闻 浏览 730

复出高效,波尔津吉斯砍30分5板4助2断3帽&得分勇士生涯新高

懂球帝 浏览 58

雅达利复刻“前竞争对手”Mattel Intellivision Sprint 游戏机

IT之家 浏览 290

销量口碑双丰收 东风奕派 007 + 推动 15 万级新能源产业提质

新华报业网 浏览 186

冬季穿衣没想象中那么难,看看这些穿搭就有灵感,保暖又好看

静儿时尚达人 浏览 207
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4