关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者106人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

徐正源:无法以全主力出战,又存在伤病,输球很遗憾

懂球帝 浏览 265

30亿元“炸弹”入场!千问烧钱搅动AI春节红包大战

华夏时报 浏览 124

俄罗斯多地遭袭

极目新闻 浏览 152

高速公路未批先建致企业受牵连关停 申请赔偿9年未果

大风新闻 浏览 231

网飞开年第一爆剧来了,快去看

独立鱼 浏览 126

稳定输出,亚历山大22中11砍35分7板6助,三分9中3&11罚10中

懂球帝 浏览 236

过渡期临近,银行业首席合规官纷纷“就位”

21金融圈 浏览 1240

支持老东家,阿什利-扬晒自己现场观战曼联客战阿森纳照片

懂球帝 浏览 120

美国"全面封锁"受制裁油轮 一艘油轮狂发75次求救信号

红星新闻 浏览 173

王楚钦退赛:突然背部不适 一度不太能动得了

北京日报 浏览 165

现在穿v领毛衣,刚好

Yuki女人故事 浏览 240

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 43

中国女足近11次对澳大利亚未尝胜绩,但在亚洲杯还没输过对方

懂球帝 浏览 37

充电5分钟就能补400公里,为什么节假日还要排队充电?

吴佩频道 浏览 258

入选全明星总次数:詹姆斯22次扩大优势,贾巴尔科比分列二三

懂球帝 浏览 97

官方:安德尔-伊恩比祖亚担任中乙广东铭途主教练

懂球帝 浏览 153

山西多地连续阴雨致农作物发霉 当地要求"抢收抢种"

极目新闻 浏览 267

刚刚确认!Model Y L登陆工信部:史上续航最长

星星car 浏览 443

影像机能爆炸,这是朱一龙最惊艳的电影之一

幕味儿 浏览 238

曼联压哨绝平!629天首次5场不败,8战热刺不胜,延续2魔咒

奥拜尔 浏览 236

夫妻欠债2.45亿移居海外被跨境追索 南京法院判了

扬子晚报 浏览 46
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4