关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技382人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 311

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 271

《共和报》评意大利杯:“是机会还是阻碍?”

绿茵情报局 浏览 138

微软研究院突破:让AI真正读懂多种语言的文化密码

科技行者 浏览 275

内维尔:我原本认为曼城状态不够稳定,但看来我大错特错了

懂球帝 浏览 270

韩综镜头下,中国南极站vs韩国世宗王站,差距大到韩网友集体破防

时评人李文君 浏览 140

美海军"林肯"号航母打击群抵达中东地区

环球网资讯 浏览 161

2025造车新势力变局:“鸿零米”改变“蔚小理”格局

21世纪经济报道 浏览 667

伊利股份业绩说明会:分红有望再创新高 9%利润率目标不变

野马财经 浏览 1322

唤醒“沉睡”数据:金山办公在沪落地“企业大脑”

看看新闻Knews 浏览 138

洛杉矶高层:签下孙兴慜是一次冒险,他展现出梅西般的影响力

懂球帝 浏览 269

乌总统在美展示地图 称1000天来俄只占领不到1%乌领土

澎湃新闻 浏览 421

返利吸存罚30万违规揽储罚160万、行长也被警告,监管剑指花式揽储

湘财Plus 浏览 12457

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 242

NBA战报:凯尔特人146-101狂胜奇才取NBA3连胜,德里克-怀特30+7+9

懂球帝 浏览 206

林俊杰称心脏出问题 经纪公司回应

环球网资讯 浏览 607

美网女单次轮:8号种子阿尼西莫娃2-0战胜乔恩特,成功晋级32强

直播吧 浏览 318

国星宇航“星算”计划 02 组星座发布

IT之家 浏览 286

哈梅内伊提出伊美谈判条件 近期不会考虑美国合作请求

环球网资讯 浏览 243

伊朗针对以色列心脏地带发起打击 对美国发出威胁

每日经济新闻 浏览 65

最高补贴1.5万元!深蓝、小米、蔚来等车企“兜底”新能源车购置税差额

红星资本局 浏览 1443
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4