关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技477人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美团国际化业务Keeta正式上线卡塔尔 7月底已拓展至沙特20城市

北京商报 浏览 471

国防部:日方若胆敢铤而走险必将碰得头破血流

界面新闻 浏览 345

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 316

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 336

专家:美方受到来自北京的迎面正击 特朗普真没招了

澎湃新闻 浏览 401

美财长称美对目前对华征收关税水平感到满意 中方回应

外交部网站 浏览 553

Claude用户注意:聊天记录将被用于AI训练,默认同意

IT之家 浏览 511

曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

萌神木木 浏览 347

温碧霞全家看江景

心静物娱 浏览 501

苹果概念持续走高 水晶光电涨超9%

证券时报 浏览 430

张朝阳:AI让人人成为“知道分子”,但我们仍需思考丨2025世界互联网大会

红星资本局 浏览 1516

smart精灵6内饰官图:为何总说“吉利味儿”很重?

车动态 浏览 104

法媒:让热亚尔与巴黎的合同明夏到期,法兰克福等队对他有意

懂球帝 浏览 289

ESG评级冲上AA,陆金所还有难题要解

节点财经 浏览 1093

官方:福建浔兴SBS俱乐部签下法国中锋约安-马昆杜

懂球帝 浏览 165

消息称vivo X300s系列手机将搭载7K大电池及2亿主摄

IT之家 浏览 259

小城大事:郑德诚风波解除,李秋萍为空降镇长

少女的烦恼 浏览 281

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 356

王家卫评论区沦陷!跟秦雯调情还曾让女配音员舔手,滤镜碎了一地

萌神木木 浏览 338

邮报:内维尔“惊讶红军球员没揍马丁内利”言论收到576起投诉

懂球帝 浏览 246

干部钱进被通报:财迷心窍 非法收受巨额财物

新京报政事儿 浏览 746
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4