关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者190人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马斯克也要涉足GEO,AI应用概念全面爆发

览富财经网 浏览 1812

仅需加92号汽油 小鹏X9增程版的谍照曝光

太平洋汽车 浏览 218

造议员假丑闻、给假新闻链接,谷歌 Gemma AI模型遭投诉后下架

IT之家 浏览 205

奔驰誓言守护V12引擎,将继续推出十二缸车型

MOTO 浏览 277

领克900首搭千里浩瀚G-ASD 新增D2D领航驾驶辅助功能

网易汽车 浏览 93

今年夏天最好看的5条裤子,谁还没穿过!

Yuki女人故事 浏览 430

40岁C罗确认:美加墨世界杯将是生涯最后1届!或2年后在沙特退役

我爱英超 浏览 170

希门尼斯:我们踢了一场好比赛;希望勒诺尔芒能尽快回归

懂球帝 浏览 210

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 201

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 216

今年秋冬最流行的4组搭配,照着穿美出新高度!

LinkFashion 浏览 227

为什么74岁的刘晓庆,突然被那么多年轻人追捧?

黎贝卡的异想世界 浏览 541

成都通报“50升油箱加67.96升汽油”事件调查结果

界面新闻 浏览 371

无法打破曼城百分记录,阿森纳英超两连平,本赛季最多拿98分

懂球帝 浏览 89

其实李亚鹏只离了两次婚!过往前任太知名,每段感情都是女方受伤

萌神木木 浏览 207

半导体封测第一股,进击汽车电子!

飞鲸投研 浏览 963

停不下来,肯扬-马丁继续怼追梦:没有库里和克莱你只是队内第12人

懂球帝 浏览 144

奥特曼零食之父,要去IPO了

投资家 浏览 1183

罗伯特-桑切斯:有人说我们夺冠之路轻松,但其实一点也不

懂球帝 浏览 453

《伟大的长征》首发预告,于和伟饰演毛泽东,总觉得差点意思

最爱酷影视 浏览 231

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 218
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4