关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者479人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联合国秘书长呼吁苏丹武装冲突各方在法希尔立即停火

国际在线 浏览 466

“装修一哥”绝境重生,国资输血7亿,7000债主表决通过重整计划

壹只灰鸽子 浏览 1242

特朗普回绝伊朗新方案

界面新闻 浏览 70

死磕影像十一年:vivo探索另一种可能

远川研究所 浏览 355

升级换代提升明显 近期即将上市新车前瞻

网易汽车 浏览 460

大疆 DJI Mini 5 Pro 无人机宣传物料曝光:1 英寸传感器

IT之家 浏览 451

克拉玛依小伙摩旅骑行3500公里去报到 大一时报名参军

极目新闻 浏览 469

明年上市 金标大众首款轿车 与众07申报信息发布

网易汽车 浏览 356

定位中大型SUV 红旗HS6 PHEV开启盲订

车质网 浏览 366

人民币汇率破7,“6时代”下对我们带来哪些影响?

郭施亮 浏览 3214

S妈含泪手捧小s奖杯,姐姐大S的遗照摆在角落

素素娱乐 浏览 264

今年秋天,穿得越放松越好看!

LinkFashion 浏览 506

口碑王|| 从2020穿到现在,越穿越爱的这件单品回来了

黎贝卡的异想世界 浏览 179

丈夫抢儿被拘15日仍不送还 女博士:儿子快不认识我了

红星新闻 浏览 28

四冠王!南外毕业生所在战队问鼎RoboMaster2025全国总冠军

现代快报 浏览 426

以总理:将确保哈马斯解除武装

国际在线 浏览 391

网传张曼玉加盟《浪姐2026》,工作人员发声回应:不知道此事

扒虾侃娱 浏览 268

富豪阮鸿献给爱女发过亿大红包,已连续三年未登上胡润百富榜

雷达财经 浏览 1270

高市称若台湾有事日美将联合救助两国公民 外交部驳斥

外交部网站 浏览 198

荷兰限制与美国情报共享:我们的情报被政治化了

澎湃新闻 浏览 372

雷军跨年直播拆车,15台手机撬动300亿市值?

BT财经 浏览 913
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4