关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技24人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

18岁农村女孩考上医学院 未等到开学因车祸不幸离世

红星新闻 浏览 32

下沉市场需要智驾吗?

汽车公社 浏览 285

2025年最适合大馋丫头小子的综艺出现了!

时尚COSMO 浏览 59

俄军抵达坠毁地点 美媒讨论“参战可能”

环球网资讯 浏览 10483

风暴眼中的岩石股份,股份冻结只是冰山一角?

天下财道社 浏览 5336

周杰伦被造谣出轨!好友曝夫妻俩相处模式,透露昆凌太乖惹争议

文艺圈娱乐号 浏览 4538

普京就“瓦格纳事件”发表讲话 绍伊古在场

界面新闻 浏览 64866

张曼玉的平价穿搭火遍全网,60岁依然是大家最爱的穿衣榜样

黎贝卡的异想世界 浏览 71

开场惊人,TVB这新剧要爆

独立鱼 浏览 3744

这四种风格的裙子 千万不要轻易尝试

潮人方法论 浏览 7456

冬季穿搭最关键的就是“保暖”!参考这16套造型,降温也不怕

静儿时尚达人 浏览 4191

《公诉》收视率狂跌,热巴转型失败真实演技"露馅"

甜小娱儿 浏览 8088

爆火情侣竟不是真人!新版Midjourney效果炸裂,网友:太可怕了

量子位 浏览 10893

夏末怎么穿?学会色彩搭配和穿衣技巧是关键

Yuki时尚酱 浏览 6234

5年前的今天:考辛斯1年530万加盟勇士 曾拒鹈鹕2年4000万报价

直播吧 浏览 7267

女生因"不当行为"被实名公告拟开除 校方涉嫌侵犯隐私

封面新闻 浏览 161

外媒:泽连斯基解除五名乌克兰国家安全局官员职务

海外网 浏览 10945

东体质疑宋凯十六字方针:目标不变属死命令,不怕压垮国足?

懂球帝 浏览 4145

墨西哥总统否认美国将对墨进行军事干预

国际在线 浏览 52

色彩,才是平淡生活里的光!

LinkFashion 浏览 307

向太发文否认控制儿媳郭碧婷 喊话会疼爱她一辈子

扒虾侃娱 浏览 5086
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4