关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技475人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卖了3199万元 德信集团董事长杭州豪宅被拍卖抵债

红星新闻 浏览 246

中超第27轮传球成功率榜:国安第一

体坛周报 浏览 348

杨乐乐一个人回娘家过年!母亲住平价小区

凉湫瑾言 浏览 168

都灵主帅:我很尊重斯帕莱蒂,我们必须带着创造历史的信念比赛

懂球帝 浏览 370

30岁孟子义再破天花板 她让整个内娱都“沉默了”

老吴教育课堂 浏览 489

攻防一体,张懿赵杰22分钟轰下27分6板5助4断助中国大胜蒙古

懂球帝 浏览 407

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 2059

异构系统实现大模型推理加速与成本优化能力提升

科技行者 浏览 132

博士学历女厅官袭燕被双开:违规收受礼金、消费卡

红星新闻 浏览 211

这些知识女性的衣橱,完全不输穿搭博主

黎贝卡的异想世界 浏览 302

孙燕姿被曝要与曲婉婷合作,二人过往互动被扒,关系亲密是好朋友

萌神木木 浏览 302

开普勒人形机器人实现全球首例“人机协作”高空焊接作业

IT之家 浏览 221

浙江广东会师全运男篮决赛,辽宁四川将争夺铜牌

懂球帝 浏览 354

深耕专业 以赛促评 2025寰球汽车年度车测评收官

网易汽车 浏览 233

谢娜演唱会现场曝光!场子不大舞台很小,网友直言花上千元不值得

萌神木木 浏览 86

《再见爱人5》收官,评论区被骂翻

白面书誏 浏览 248

DO:布伦特福德拒绝了纽卡对维萨的4000万英镑最新报价

懂球帝 浏览 503

特斯拉智能辅助驾驶里程已超100亿公里

大象新闻 浏览 275

70后“黎杨配”新组合首交“考卷”,广西北部湾银行2024年业绩如何?

Daily每日财报 浏览 3739

推广中奖名单-更新至2025年10月10日推广

黎贝卡的异想世界 浏览 298

铜梁龙李镇全谈冲超:有这么多人支持我们,为什么不能冲超?

懂球帝 浏览 351
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4