关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者362人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奔驰今年大动作: 推15款新车 智驾覆盖全系

网易汽车 浏览 231

合肥夜空上演“硬核”科技告白:1024架无人机点亮AI愿景

中安在线 浏览 366

DO:谢菲联与曼城就租借菲利普斯达成协议,球员将接受体检

懂球帝 浏览 260

关税预期与矿山停产“共振”,伦铜首次突破1.2万美元再创历史新高

华尔街见闻官方 浏览 5494

工程师崩溃!某车企研发开始试行“两班倒”!

明镜pro 浏览 404

错过四次话语权竞争,中国用一座“有生命力”的工厂重新赢得主场

智谷趋势 浏览 8589

汽车豪门法拉利掀母子撕逼战 继承人遭母亲"背刺"

澎湃新闻 浏览 328

"幽灵外卖"被重罚 58同城APP上又现"幽灵订单"

澎湃新闻 浏览 148

A股并购重组活跃 产业整合趋势增强

商业观察杂志社 浏览 1297

三年巨亏30亿,鹏华基金闫思倩的“光环”与持有人的“叹息”

一地基毛 浏览 1245

韩素希再谈与柳俊烈李惠利争议:还能怎么办呢

韩小娱 浏览 213

原来甄子丹还有个大儿子,都已经31岁了

上官晚安 浏览 254

在南海坠毁的美军机比F-35还贵 单价1亿美元

参考消息 浏览 310

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 342

欧乌给美俄峰会提条件

环球网资讯 浏览 512

六氟磷酸锂“带飞”氟化工,衢州启动“中国氟谷”的底气在哪里?

时代周报 浏览 1378

伊姐周六热推:电视剧《勿扰飞升》;电视剧《他为什么依然单身》......

伊周潮流 浏览 352

豆包手机助手调整AI操作能力,刷分、金融类应用、部分游戏等三大场景将限制使用

澎湃新闻 浏览 340

长剧2025:三年来最差,但仍有希望

钛媒体APP 浏览 255

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者 浏览 509

高盛:人工智能热潮并非泡沫,才刚刚起步

IT之家 浏览 389
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4