可可资讯

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

熊黛林突然公...

宇树180芭...

50岁穿衣就...

李书福狠不起...

中国男篮28...

加入更多专属...

同样是“好男人”，把黄磊、吴京、沙溢放一起看，都露出了马脚

虞书欣父母五度被曝欠债，本人身价上亿没钱还债？

在抖音商城38好物节，众品牌、商家以低价格、好服务成就好生意

18岁农村女孩考上医学院未等到开学因车祸不幸离世

下沉市场需要智驾吗？

2025年最适合大馋丫头小子的综艺出现了！

俄军抵达坠毁地点美媒讨论“参战可能”

风暴眼中的岩石股份，股份冻结只是冰山一角？

周杰伦被造谣出轨！好友曝夫妻俩相处模式，透露昆凌太乖惹争议

普京就“瓦格纳事件”发表讲话绍伊古在场

张曼玉的平价穿搭火遍全网，60岁依然是大家最爱的穿衣榜样

开场惊人，TVB这新剧要爆

这四种风格的裙子千万不要轻易尝试

冬季穿搭最关键的就是“保暖”！参考这16套造型，降温也不怕

《公诉》收视率狂跌，热巴转型失败真实演技＂露馅＂

爆火情侣竟不是真人！新版Midjourney效果炸裂，网友：太可怕了

夏末怎么穿？学会色彩搭配和穿衣技巧是关键

5年前的今天：考辛斯1年530万加盟勇士曾拒鹈鹕2年4000万报价

女生因＂不当行为＂被实名公告拟开除校方涉嫌侵犯隐私

外媒：泽连斯基解除五名乌克兰国家安全局官员职务

东体质疑宋凯十六字方针：目标不变属死命令，不怕压垮国足？

墨西哥总统否认美国将对墨进行军事干预

色彩，才是平淡生活里的光！

向太发文否认控制儿媳郭碧婷喊话会疼爱她一辈子