关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者400人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

NBA球员工会:我们与明州人民站在一起,必须捍卫言论自由的权利

懂球帝 浏览 177

奔驰同意!支付超10亿元

大象新闻 浏览 220

乔治亚大学团队让大型语言模型学会"精打细算"的思考方式

科技行者 浏览 245

21载热血传承!2025肯德基三人篮球赛燃动青春赛场

中国商报 浏览 2005

新茶饮扎堆登陆港股 蜜雪冰城通过上市聆讯

中国商报 浏览 3878

搭载增程动力 大众ID.ERA量产版2026年上市

车质网 浏览 252

曾虚假记载被ST!多次商誉爆雷!这家公司又要并购……

IPO日报 浏览 10794

笑掉大牙!日票房仅199万,黄晓明的新片,被“小李子”打懵了

温柔娱公子 浏览 300

泽连斯基称乌方已妥协不加入北约 俄方发声

每日经济新闻 浏览 219

50+女人怎么穿出时尚感?掌握这3招技巧,重新定义优雅与潮流

静儿时尚达人 浏览 283

美国宣布针对伊朗实施新一轮制裁

上观新闻 浏览 134

收购两公司 探路者加码芯片业务

北京商报 浏览 2747

陈明昊熬出来了,正儿八经当主角,新片吴京力荐,出演追债大哥

最爱酷影视 浏览 411

S=更入门?大众速腾S工信部信息曝光

网易汽车 浏览 158

苹果发布 M4 iPad Air:加入 C1X 芯片 4799 元起售

威锋网 浏览 101

第五届意大利繁花电影节片单暨日程发布!

幕味儿 浏览 320

80后造AI卫星,要IPO了

投资家 浏览 9761

媒体:宗馥莉终于彻底告别宗庆后

每日经济新闻 浏览 417

TA:诺丁汉森林不会因对阵曼联存在角球误判向裁判机构上诉

懂球帝 浏览 276

湖北U20 1-0山东U20,范绪林点射制胜

懂球帝 浏览 254

阿里达摩院推出电商智能体全面测试基准

科技行者 浏览 180
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4