关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者242人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

柳云龙:与初恋结婚,婚后生一女,如今咋样了?

人间无味啊 浏览 387

"最快女护士"张水华获得"复出"后首个全马冠军

纵览新闻 浏览 355

烂!58岁邹兆龙翻拍《怒火重案》,擦边卖肉制作粗糙,票房仅65万

靠谱电影君 浏览 254

看来看去还是这些穿搭舒适!深浅互补、多穿阔腿裤,简约自然

静儿时尚达人 浏览 417

职业老炮入局,中炬高新刮骨疗伤

斑马消费 浏览 1184

“空降”印奇和50亿,阶跃星辰上桌了吗?

字母榜 浏览 979

推广|| 春天第一双鞋!暴走不累、搭遍好看小裙子

黎贝卡的异想世界 浏览 160

秋到没边的氛围感美甲,一眼心动

时尚COSMO 浏览 337

德大选倒计时,魏德尔靠山到位,对华态度明确

浏览 705

6.4万star的开源智能体框架重构!OpenHands重大升级,叫板OpenAI

机器之心Pro 浏览 370

具身智能何时实现“ChatGPT时刻”,王兴兴说了个关键前提丨聚焦进博会

红星资本局 浏览 2549

央视披露:"哪吒"造车3年亏183亿 多地国资投资难追回

新京报政事儿 浏览 85

稳扎稳打!杜兰特半场8中5拿到10分2板2助 正负值+3

直播吧 浏览 621

月销破2万辆 极狐年销翻番在望 摸到准一线门槛

乐逗汽车 浏览 352

英国通胀率跃升至3%,还能降息吗?​

国际金融报 浏览 4061

美媒披露:美空军8天内向中东地区调派至少42架重型运输机

环球网 浏览 229

杨家玉夺全运第2金!马拉松竞走混合接力:北京一队刷PB夺冠

全景体育V 浏览 341

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 320

幸福!孙杨张豆豆自曝结婚3年育有一娃

818体育 浏览 98

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 405

委内瑞拉代总统:我“受够了”来自华盛顿的命令

扬子晚报 浏览 249
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4