关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者196人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

局势紧张!波兰边境增兵

环球网资讯 浏览 6156

章泽天大学素颜照被疯传 与现在判若两人

木子爱娱乐大号 浏览 8217

iPhone Air 2已在路上:升级2nm芯片 补齐影像续航短板

快科技 浏览 36

章子怡结束日本游回国,约闺蜜逛街购物超开心,司机帮撑伞好贴心

扒虾侃娱 浏览 4270

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 68

在歼35之后,空军版歼31隐形战斗机也来了

浏览 2606

汪小菲带孩子去日本,女儿一头长发酷似大S,孩子依旧不让回北京

萌神木木 浏览 2272

俄总统助理:普京和特朗普会晤意愿依旧存在

每日经济新闻 浏览 69

华为商城Mate 60/Pro系列配件一折促销,9.9元买官方保护壳

IT之家 浏览 69

大成基金:“高新技术产业股票A”成立8年多收益率260%,最大回撤45.77%

面包财经 浏览 12085

有品味的女人都不穿牛仔裤,其实过膝裙更适合你,优雅又显瘦

静儿时尚达人 浏览 4249

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 35

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 9

别随便穿搭,穿对了才高级

静儿时尚达人 浏览 4728

奇才120-103尼克斯,巴格利18+11,亚布塞莱11分,克拉克森12分

懂球帝 浏览 79

蓄发哥开始重新等待五连胜,阿莫林:希望他能尽快剪掉头发

懂球帝 浏览 46

华为注册多个鸿蒙商标,4月正式开启旗下产品系统升级

趣看热点 浏览 107877

人人都能是导演:苹果 Final Cut Camera 2.0 上新

IT之家 浏览 147

39岁热依扎硬演17岁少女,我竟然0秒就接受了

动物奇奇怪怪 浏览 166

不退役!记者:克罗斯计划与皇马续约一年

直播吧 浏览 10830

特朗普:乌克兰不该"挑战比自己大十倍的国家"

环球时报国际 浏览 203
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4