关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者324人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李想评豆包手机为现象级AI产品 努比亚回应:带来自动驾驶式体验升级

快科技 浏览 58

工业与人形机器人蓬勃发展 稀土需求有望迎来几何级增长

金证研 浏览 376

吉利全球全域安全中心发布 领克900完成碰撞测试

太平洋汽车 浏览 120

一个月了,怎么还在骂啊?

麻辣婊 浏览 219

荣耀Magic8 Pro Air手机线下展出,影像、显示等核心参数公开

IT之家 浏览 81

美防长:已做好战争准备 谁开第一枪就见不到明天太阳

军机Talk 浏览 105

美ICE当街打死一人 施救医生:特工忙着数他身上的弹孔

红星新闻 浏览 69

美媒:特朗普敲打高市 要求日本在台海问题上降调

观察者网 浏览 147

Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死

新智元 浏览 515

42家A股上市银行半年报:营收均实现同比正增长,六大行将分红超2000亿

红星资本局 浏览 942

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 63

贵=好用?这个刚需我们试了一堆才选到合适的

黎贝卡的异想世界 浏览 216

吉林长春中东新天地购物公园:丰富多元体验 焕新商业地标

中国商报 浏览 830

菲亚特Punto Racer:九十年代意式小钢炮的遗珠

老爷车 浏览 193

21载热血传承!2025肯德基三人篮球赛燃动青春赛场

中国商报 浏览 1928

以色列政府批准加沙停火协议

新华社 浏览 207

刘嘉玲怒怼肉娱小鲜肉?

港剧叔 浏览 208

周末重大利好!阿里巴巴给国产算力空中加油,三星、SK海力士被美国撤销豁免

看财经show 浏览 750

美国将向中东增派航母 伊朗:将坚决回应任何侵略行为

环球网资讯 浏览 99

今日热点:ador或将拒绝newjeans另外三人回归#;徐晟津就星辰大海睡觉道歉……

伊周潮流 浏览 170

美小盘股还有机会吗

国际金融报 浏览 2669
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4