关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者33人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

应对“中俄挑战”美国海军酝酿结构大调整

环球网资讯 浏览 4270

史上最强性能,Abarth首款纯电车型谍照曝光

天天汽车 浏览 4048

程前向周鸿祎道歉:失态失礼,回头看自己都觉得不可原谅

网易科技频道 浏览 4156

今日热点:宫崎骏在筹备新作品;绿泡泡疑似离开央视......

伊周潮流 浏览 2541

中年男人,比变老更可怕的是“选错发型”!显老土气,油腻感十足

潮人志Fashion 浏览 4564

菲近期屡次制造摩擦 美媒称中菲海警热线电话已停

环球网资讯 浏览 6154

旧车比新车贵,比亚迪断了二手车贩子活路

网易科技报道 浏览 2189

不止更快更强 体验比亚迪DiLink 4.0 5G版

网易汽车 浏览 12158

直击2024CES | TCL展示115吋全球最大QD-Mini LED电视

网易科技报道 浏览 4183

塔图姆:伯德是凯尔特人队史最佳 他是值得追逐的伟大球员

直播吧 浏览 262

车企6月成绩出炉,多品牌创纪录,极氪、零跑崛起!

电车通 浏览 2092

红海危机下,陆路货运作为替代方案更加急迫

环球时报国际 浏览 5408

“露奶装”又流行了,撩到你腿软!

Yuki女人故事 浏览 51

基辅遭大规模袭击泽连斯基称"期待中国表态" 中方回应

外交部网站 浏览 41

美国父母起诉OpenAI:指控ChatGPT害死其16岁儿子

文汇报 浏览 39

CBS:错过梅西,利雅得新月准备4500万欧报价内马尔&提供2亿年薪

直播吧 浏览 8075

马国明透露将与汤洛雯在年底前结婚 自曝想生两个

网易娱乐 浏览 11277

全国人大代表、阳光电源董事长曹仁贤:支持燃料电池并网发电

时代周报 浏览 11809

美今夏发卫星欲跟踪中俄航天器?专家解读

环球网资讯 浏览 7737

前TVB男星直言想生二胎 妻子4年前以52岁高龄诞女

TVB剧评社 浏览 7180

马拉多纳曾摔伤头部,独自在家中三天无人照料

趣看热点 浏览 17468
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4