关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者478人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨振宁和她的53年婚姻,是这样的

Yuki女人故事 浏览 357

AI聊天机器人背后的肯尼亚劳工:每条“我爱你”付费0.05美元

DeepTech深科技 浏览 268

果壳直击CES:具身智能下班时刻

果壳 浏览 261

金正恩将出席纪念活动 外交部回应

北京青年报 浏览 502

透视四川政府工作报告:向“第四极”加速奔跑

尺度商业 浏览 1506

秦煌如今过成这样只能算他活该?

一针见娱 浏览 413

会“穿”丝巾的女人,美的更高级

LinkFashion 浏览 483

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 365

郭富城夫妇合体看赛马,透露三胎预产期

疯说时尚 浏览 382

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 380

1.5亿利润与12亿负债,祥源文旅为何景区造血,债务“起飞”?

华夏时报 浏览 2069

大主播单飞带货“千万首秀”,东方甄选业绩“重挫”股价

伯虎财经 浏览 1344

这俩人原来是夫妻,因拍《红楼梦》结缘

素衣读史 浏览 298

升第三!深圳双杀山西11连胜创队史纪录 王浩然33分生涯新高

醉卧浮生 浏览 125

北京独生女被男友殴打致残:他让我再买房写他儿子名字

黄河新闻网吕梁频道 浏览 256

奶茶冲泡巨头香飘飘“突围”:首家线下茶饮店将开业,曾多次试水快闪店

红星资本局 浏览 1345

赫罗纳已摸清RCDE球场的底细

绿茵情报局 浏览 228

纯电续航提升 2026款比亚迪夏将于明日上市

车质网 浏览 327

76人新赛季不败金身被破,全胜球队仅剩马刺、雷霆和公牛

懂球帝 浏览 314

林子烨:被粉丝捧成“小张凌赫”,一场活动就塌房?

八卦三缺一 浏览 98

达伦-本特:切尔西应该签回弟媳,他看起来依然很出色

懂球帝 浏览 298
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4