关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者261人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

安卓版谷歌Gemini AI助手灰度测试“聊天历史记录搜索”功能

IT之家 浏览 475

NBA球员工会:我们与明州人民站在一起,必须捍卫言论自由的权利

懂球帝 浏览 150

万亿“宁王”,又出手

中国基金报 浏览 1319

李在明送特朗普的金冠是镀金的 纯金太贵得花150万元

极目新闻 浏览 271

小米集团宣布最高25亿港元的自动股份回购计划并将注销

网易财经 浏览 2328

恭喜!49岁萧煌奇官宣结婚,和妻子晒结婚戒指分享甜蜜

素素娱乐 浏览 147

伊朗外长:新任最高领袖将在"一或两天"内被选出

参考消息 浏览 60

上海优化政策释放住房消费需求

商业观察杂志社 浏览 2018

视界大会短剧演员好尴尬!走红毯扎堆不给镜头,后台跟明星分开坐

萌神木木 浏览 218

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 190

一加 15 真机曝光,设计风格延续一加 13T

IT之家 浏览 342

“长+短”穿法今年冬天又火了!照着穿时髦又显高

LinkFashion 浏览 197

U23国足战越南官方阵型: 4-4-2!鲍盛鑫中场,蒯纪闻搭档向余望,胡荷韬可落位边后卫>>

懂球帝 浏览 131

悦龙科技闯关北交所:研发人员大量流失,大客户秒变孙公司惹隐忧

叩叩财讯 浏览 1101

伊朗军队总司令:“我们的手始终放在扳机上”

环球网资讯 浏览 100

梅州众将:不管未来怎样都要打好最后一场,拼出个保级机会

懂球帝 浏览 191

在特斯拉model Y和小米 YU7里二选一,怎么选?

蜗牛车志V 浏览 121

国产晶圆代工双雄现并购分野:中芯国际停牌收购子公司,华虹半导体复牌吸并“兄弟”资产

国际金融报 浏览 8655

俄军空袭乌克兰首都基辅 供电供暖大范围中断

界面新闻 浏览 149

62岁农村大爷打赏女主播50万 全家人一查账单直接傻眼

极目新闻 浏览 342

特朗普又改口:印巴冲突期间有7架战机被击落

环球网资讯 浏览 395
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4