可可资讯

这是一个关于人工智能如何学会更好地思考的故事。想象一下，你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案，但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了"，而不是真正理解为什么。如今，来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法，让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月，论文编号为arXiv:2601.22642。

这个故事的核心很有趣：当今最强大的语言模型，比如ChatGPT和Claude，在处理复杂推理问题时，常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下，推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时，这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案，但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于，他们不是简单地让AI生成答案就完事，而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

香港科技大学团队发现形式化验证如何让AI推理更聪明

标配高阶智驾...

阿富汗称与巴...

货拉拉等平台...

大S纪念雕像...

德央行行长妄...

再见美拉德，...

徐尚：徐彬能去欧洲我们肯定大力支持，李昊杨希去留再议

李羲承退出ENHYPEN，组合未来将以六人形式活动

法军总参谋长离任前警告：俄罗斯或在五年内进攻欧洲

长安汽车2026Q1财报:营收327亿元海外销量大增

2026年春晚分会场官宣周深肖战刘宇宁令人期待

40岁宋仲基带老婆参加友人婚礼，被误认成徐帆

深圳联通官宣可预约上门办理eSIM业务，暂定截至10月31日

搭上芯片“黑马”新凯来的光伏龙头，高管集体减持，股价大跌超7%

古利特：皇马3个前锋无球时做的太少，贝林厄姆成为受害者

罗马诺：贝蒂斯拒绝斯图加特对阿尔蒂米拉的报价，认为其潜力巨大

雪花丨诗一首

今年冬天最时髦保暖的4组搭配，照着穿美出新高度！

女子在酒店裸睡维修工突然闯入:睁眼发现对面站了个人

国际化野心不减？信达生物拿下巨额BD，总额114亿美元创纪录，股价不涨反跌

女演员自曝曾遭受校园暴力！留下心理阴影

陈匡怡怒斥台媒毁人名节，自曝写了遗书

每年火一个“红毯惊鸿一瞥”，今年轮到谁？

马斯克：比尔盖茨最好尽快平掉特斯拉空头头寸

陈妍希带娃现身海口，儿子小星星近状曝光，母子俩牵手同行好温馨

太阳报：奥利塞帮助埃泽适应枪手新生活，二人经常会在线下棋

小米汽车又一重要专利公布！

机器狗浇花、机器人越野：这比赛比综艺还好看

如鱼得水！福克斯半场10中5得13分5板4助1断1帽得分暂全队最高

女人不管多大年龄，夏天都应该准备一条短裤，舒适百搭又松弛