关闭广告

阿尔伯塔大学新突破:让AI学会自我检查错误,准确率远超人工审核

科技行者150人阅读


这项由加拿大阿尔伯塔大学的Amirhosein Ghasemabadi和Di Niu教授领导的研究发表于2026年1月的arXiv预印本服务器,论文编号为2512.20578v2,有兴趣深入了解的读者可以通过该编号查询完整论文。

现在的人工智能聊天机器人就像一个极其博学但有时会胡说八道的朋友。它们能够流利地回答各种问题,写出看似合理的文章,但有时却会信口开河,编造出一些看起来很有道理但实际上完全错误的内容。更糟糕的是,它们往往意识不到自己在撒谎。

阿尔伯塔大学的研究团队决定解决这个让人头疼的问题。他们开发了一套名为"Gnosis"的系统,这个名字来源于希腊语,意思是"知识"。这套系统的神奇之处在于,它能让AI在回答问题的过程中,实时观察自己的"思维状态",判断自己即将说出的话是否可靠。

传统的方法就像请另一位专家来检查第一位专家的答案,或者让同一位专家回答同一个问题多次,看看答案是否一致。但这些方法要么需要额外的计算资源,要么准确性不够高。Gnosis系统则完全不同,它就像给AI装上了一个内置的"诚实检测器",让AI在说话的同时就能判断自己是否在胡说八道。

<
上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华硕带来ROG XG Station 3(Thunderbolt 5):开放式显卡坞,配雷电5接口

超能网 浏览 427

红色不流行了?今年最火的穿搭居然是它

LinkFashion 浏览 220

鹿晗关晓彤恋爱期间毫不避讳?

娱晓晓 浏览 215

全时区・强流动性|ACCM 助力投资人把握贵金属时代红利

商业观察杂志社 浏览 5009

女子酒后与妹妹因清理狗屎起争执 将2只狗从21楼扔下

都市快报橙柿互动 浏览 384

网红基金,历史性暴跌

中国新闻周刊 浏览 961

宁德时代成立新能动力科技公司 注册资本20亿元

证券时报 浏览 346

xbench实验室发布:如何让AI代理真正走进普通用户的日常生活?

科技行者 浏览 110

入秋第一件打底衫!你买这3件,太好看了!

Yuki女人故事 浏览 321

VNU University of Science:精准调控技术提升机器人执行能力

科技行者 浏览 125

中国犀旺队|欧塞尔共研青训,法国集训圆满结束 

绿茵情报局 浏览 10

华为“三界”入局 高端MPV混战白热化

汽势传媒 浏览 18

秋天穿一件开着花的衣服,很美!

LinkFashion 浏览 418

震惊世界的3小时:美国“闪击”委内瑞拉的事实与疑问

南方都市报 浏览 170

1万亿订单再加3500-5000亿美元!OpenAI“停不下来”,“当你欠每家数千亿美元,钱的问题自己会解决”?

华尔街见闻官方 浏览 1106

谁是中国第一吐槽役?

仙女事件簿 浏览 306

扭亏!净赚超3亿元,物业龙头雅生活服务,翻身

侃见财经 浏览 612

AI重构双11|成交暴涨25倍,智能眼镜从极客玩具到大众爆款

红星新闻 浏览 239

普京:俄方已无兴趣等待乌从其占领区撤出

每日经济新闻 浏览 192

AI信任危机加剧:Sora视频“以假乱真”,国内灰产3元“洗白”水印

蓝鲸新闻 浏览 286

郑爽在美国越混越差!打官司诉讼费都掏不起,前夫张恒比她还沦落

萌神木木 浏览 166
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4