关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者380人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苹果发布 M4 iPad Air:加入 C1X 芯片 4799 元起售

威锋网 浏览 75

媒体人:绿军双探花我会选杰伦-布朗,塔图姆已不是熟悉的他了

懂球帝 浏览 156

月薪涨150被骂抠门?宁德时代宣布涨薪,回应来了;小米汽车将开放「现车选购」,预计年底前可提;字节联手中兴打造首款豆包助手手机

雷峰网 浏览 208

何晴病重照流出,儿子跟前夫生活病中无亲属照顾,人生末路显凄凉

不八卦会死星人 浏览 176

伊朗外长:伊朗给美国人"准备了许多惊喜"

界面新闻 浏览 58

郑钦文排名跌至世界第24!年终确定跌出前20 不影响澳网种子席位

风过乡 浏览 274

"东风-5C"烧饼卖疯了 研究生小伙卖烧饼被小学生疯抢

FM93浙江交通之声 浏览 377

双剑合璧:科创板、创业板的重大改革与长期投资价值

尺度商业 浏览 2611

秋冬别穿阔腿裤了!裙子才是粗腿女孩的救星!

Yuki女人故事 浏览 235

理财代销加速下沉 热销背后警惕收益率“美化”

北京商报 浏览 4696

尹锡悦宣布戒严当晚 金建希与其争吵:因为你全搞砸了

每日经济新闻 浏览 190

五菱缤果S内饰曝光 换大屏大面积软包

网易汽车 浏览 369

结构性货币政策工具扩容 降准降息可期

北京商报 浏览 1897

俄军连续45天被机枪火力压制 乌军"秘密武器"被披露

环球网资讯 浏览 115

深圳联通官宣可预约上门办理eSIM业务,暂定截至10月31日

IT之家 浏览 227

宋慧乔怎么不会老啊?

时尚COSMO 浏览 182

当众辱骂阿隆索!1.5亿欧熊皇惹怒老佛爷+更衣室 皇马准备处罚他

风过乡 浏览 280

一天两失利!国家队和民营航天双双遇挫!股民最担心的事来了

深蓝财经 浏览 1087

印度的“真正敌人” 莫迪挑明了

参考消息 浏览 352

小号普拉多 丰田兰德酷路泽FJ全球首发亮相

车质网 浏览 253

智慧养殖+食品放量双轮驱动 天马科技烤鳗销量增72%

时代周报 浏览 963
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4