关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者325人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西班牙拒绝加入美国发起的“和平委员会”

国际在线 浏览 88

新基金业绩大分化

国际金融报 浏览 1240

任正非最新讲话:没有网络的算力是信息孤岛

澎湃新闻 浏览 175

东升西降?拆解全球车企三季报,中国车企业绩更稳

大李说车 浏览 175

1200亿天价订单疑云:宁德时代为何押注一家“小公司”?

野马财经 浏览 946

落石砸车致司机身亡家属向政府索赔百万 遗体尚未安葬

极目新闻 浏览 421

现场视频:解放军无人机视角看台北101大厦

央视新闻 浏览 98

乐道推7年超低息金融方案 年化费率低至0.49%

网易汽车 浏览 64

唤醒“沉睡”数据:金山办公在沪落地“企业大脑”

看看新闻Knews 浏览 65

帽子选对,风格翻倍!冬日造型点睛术

Yuki女人故事 浏览 84

特朗普发布一张个人黑白照片 并自诩为“关税之王”

环球时报国际 浏览 76

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 670

39集《沉默的荣耀》大结局前瞻,5人再无反转,黎晴成唯一变数

娱乐圈笔娱君 浏览 262

L90 产品故事:放下理想主义执念,接受必要的 “庸俗”

晚点LatePost 浏览 103

曾随海港4次夺冠!33岁名将告别中超 不舍离开将屈尊B队+征战中乙

我爱英超 浏览 97

她与名导同居多年被抛弃,如今复出却无人问津

吴蒂旅行ing 浏览 220

商业火箭勇闯A股!已有IPO进入辅导验收

券商中国 浏览 3669

蚂蚁集团连续三年获评 Top Employer“中国杰出雇主”

澎湃新闻 浏览 598

孔蒂:球迷应忽略球队的谣言;欧洲裁判比意甲好?我不聊这个

懂球帝 浏览 226

基金经理任期内亏损近40%,还让人“抄作业”

财通社 浏览 857

马德兴:汪士钦落选是因为熊猫杯引发舆情,于金永身体不适

懂球帝 浏览 147
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4