关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技326人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 111

仝卓表弟获救了!照片曝光头发已被剃光,从求助到救出不到24小时

萌神木木 浏览 140

奥特曼开始算“人肉成本”

虎嗅APP 浏览 5378

AI算力需求升级 国产算力迎持续发展窗口期

金证研 浏览 1112

比朔夫:最喜欢的球员是维蒂尼亚和基米希;梅罗选谁?梅西

懂球帝 浏览 91

下一个周期,我们为什么必须关注这十大黄金赛道?

智谷趋势 浏览 1140

AI图像检测器"视觉盲区":中科院揭示现有技术如何被轻松"欺骗"

科技行者 浏览 60

雷军直播四小时回应质疑

大象新闻 浏览 105

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 176

环球:荷兰不要低估中方维护正当权益的决心与能力

环球网资讯 浏览 226

希尔德:追梦可能是篮球史上的最强防守者,他在防守端功力深厚

懂球帝 浏览 260

还是这些穿搭适合秋天!衣服多穿一下“基础款”,百搭又舒适

静儿时尚达人 浏览 233

夏天尽量少穿一身黑,试试印花裙和露肩上衣,高级又显气质

静儿时尚达人 浏览 435

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 249

账面1000多亿,却隐藏20多年,整个互联网都找不到它长什么样

壹只灰鸽子 浏览 659

好久没跟大家线下见面啦,快来找我玩

黎贝卡的异想世界 浏览 145

没有你早花了!罗伊斯-奥尼尔半场三分6中4砍15分2断&次节12分!

直播吧 浏览 500

刀郎巡演即将结束,释放3个的信号,又要隐退了?

小丸子的娱乐圈 浏览 345

日本呼吁各国不要参加中国九三阅兵活动 外交部回应

澎湃新闻 浏览 354

马斯克疑悄悄搁置"美国党"计划:或支持万斯2028竞选

红星新闻 浏览 396

美国为何长期觊觎委石油 委专家:对美具有互补性

海外网 浏览 118
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4