关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者477人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海双雄克星!艾曼3战独造5球,助攻双响后被队友“擦鞋”

奥拜尔 浏览 309

香港上市公司董事薪酬榜:李想6.8亿港元居首,布鲁可创始人朱伟松排第六

红星资本局 浏览 1535

鸣鸣很忙明天上市:获腾讯淡马锡等2亿美元融资 市值将超800亿

雷递 浏览 250

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 324

暖心!海鸥飞过球场被皮球击中晕倒跌落,球员做心肺复苏将它救活

风过乡 浏览 188

5月首发亮相奕派M8 奕派科技4月销量20537辆

网易汽车 浏览 66

他入行30年不温不火,回村务农却火了

艳儿说电影 浏览 386

马斯克:比尔盖茨最好尽快平掉特斯拉空头头寸

鞭牛士 浏览 7391

无效传控!34分钟哈兰德的进球是曼城本场比赛最后一脚射正...

直播吧 浏览 488

测试显示:误使用家用清洁剂难致苹果iPhone 17 Pro机身明显变色

IT之家 浏览 247

《寂静的朋友》全亚洲登陆,梁朝伟出演大尺度镜头,很可能被删减

最爱酷影视 浏览 348

德转预热拉什福德新一期身价:最低可能跌至3000万欧

懂球帝 浏览 349

曾随海港4次夺冠!33岁名将告别中超 不舍离开将屈尊B队+征战中乙

我爱英超 浏览 244

三战全胜,巴列卡诺主帅伊尼戈-佩雷斯当选西甲10月最佳教练

懂球帝 浏览 351

安徽小伙辍学卖馒头,今年已赚13亿

创业家 浏览 2589

纳米级OLED突破:科学家开发出全球最小发光像素,仅 300nm² 见方

IT之家 浏览 395

全智贤新剧跌破平台下线,迪士尼2亿投资亏本,业内直言堪称灾难

萌神木木 浏览 411

伊媒披露以试图暗杀伊朗总统细节:发射6枚导弹或炸弹

环球网资讯 浏览 578

Jane Street、Citadel Securities三季度业绩强劲,全年有望创纪录

华尔街见闻官方 浏览 2873

上汽大众2025全年终端销售106万辆 12月单月终端销售9.6万辆

网易汽车 浏览 250

全新丰田凯美瑞上市!售价亲民,全新外观年轻动感,搭载2.5L双擎

小史谈车 浏览 224
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4