关闭广告

蒙特利尔大学团队发现让AI"分段思考"的惊人秘密

科技行者179人阅读


这项由蒙特利尔大学Mila实验室的Milad Aghajohari、Kamran Chitsaz、Amirhossein Kazemnejad等研究人员与微软研究院、麦吉尔大学、ServiceNow研究部门合作完成的研究,发表于2025年的arXiv预印本平台(论文编号:arXiv:2510.06557v1)。有兴趣深入了解的读者可以通过该编号查询完整论文,也可以访问研究团队公开的代码仓库和模型权重。

你有没有想过,当我们思考一个复杂问题时,大脑是怎么工作的?比如解一道数学题,我们不会把所有信息都塞在脑海里,而是会分步骤推理,把重要的中间结果记下来,然后基于这些关键信息继续思考。然而,目前最先进的AI模型在"思考"时却不是这样的——它们就像一个强迫症患者,必须把之前想过的每一个字都牢牢记住,这让它们在处理复杂问题时变得极其耗费计算资源。

研究团队发现了一个令人震惊的现象:让一个小巧的1.5B参数模型采用"分段思考"的方式,竟然能在数学竞赛题目上击败那些使用传统"长篇大论思考"方式的大型模型,而且计算成本只有后者的四分之一。这就好比一个聪明的学生用简洁的草稿纸就能解出难题,而另一个学生却需要写满厚厚的笔记本才能

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

浙江大学StaMo实现静态图像生成机器人动作

科技行者 浏览 190

曹西平告别葬礼举行,灵堂布置很温馨,小S送花篮哀悼

素素娱乐 浏览 73

京东卖车翻车:汽车电商为何屡战屡败?

天天汽车 浏览 143

轴距加长 广汽丰田雷凌L上市售12.98万起

网易汽车 浏览 95

ESPN:由于接受了手术,菲利普斯预计要到冬窗才能离开曼城

懂球帝 浏览 308

阿里云计算如何让大语言模型吃得更聪明

科技行者 浏览 68

通义实验室负责人周靖人成为阿里合伙人;小米澎湃 OS 全球版性能追平中国版 | 早资道

封面新闻 浏览 130

俄罗斯SALUTEDEV团队VIBE:超轻量AI实现高效图片编辑

科技行者 浏览 69

排队200桌,这个地域火锅成了今冬“顶流”

餐饮老板内参 浏览 802

你的凉鞋该换啦!今夏流行这5双,巨火巨时髦!

Yuki女人故事 浏览 415

4年“伺候”4位总经理,水井坊公关一号位挂印封金

财经众议院 浏览 5368

辞旧迎新,元旦档电影满意度发布!

幕味儿 浏览 102

油车首搭华为鸿蒙座舱!日产中国庆生40年,甩出三款新车,补全插混拼图

车东西 浏览 220

《唐诡3》将至,苏无名卢凌风兄弟反目,8大诡案一个比一个瘆得慌

最爱酷影视 浏览 239

《今日说法》主持人李晓东从央视离职 曾买茶叶被骗

封面新闻 浏览 54

通过民间借贷获取大额回报,利用职务便利低买高卖房产......农行冯建龙被开除党籍

财通社 浏览 2755

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 112

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 166

美国官员:美国防部阻止乌使用远程导弹打击俄罗斯

大象新闻 浏览 297

网坛名宿预测德约在澳网后退役,被六千名塞尔维亚球迷围攻

网球之家 浏览 188

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

北青网-北京青年报 浏览 139
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4