可可资讯

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

记者：卡里克...

马杜罗受审 ...

杨家玉夺全运...

俄乌两国元首...

短剧《还珠》...

多人手机信号...

华硕推出《崩坏 3》限定礼盒，内含爱莉希雅主题 ROG Phone 配件

泰国海军做好战争准备特朗普要电话调停泰柬冲突

最新锐超绝的北美电影组合，即将首访北京！

华润啤酒半年报：高端啤酒赚更多，净利润增速远超营收增速

政府“停摆”持续，美国家核安全管理局千余名员工将被强制休假

轴距进行加长奥迪A7L旅行版国内谍照曝光

解码科创成长层药企2025年成绩单

“京圈恶少”王烁：睡遍娱乐圈女星，殴打继母王艳，枪指刘涛老公

戴伟浚：我肯定憋着一股劲，要在深圳新鹏城证明自己

4名游客遭马蜂袭击送医抢救：满头被蜇头发都剃光了

技术门槛很低的增程技术，为什么越卖越贵？

闻泰科技营收147亿的半导体资产被荷兰政府冻结

岚图泰山X8大湾区登场！粤港澳迎来8系唯一四激光全地形SUV

六姊妹结局：张秋林的算计不止用在了何家欢身上，还有方涛和刘妈

NBA战报：爵士123-110篮网，马尔卡宁30+8+1

综合补贴8.78万元起星光730尊享型正式上市

斯帕莱蒂为跑轰尤文注入灵魂，奥彭达被重新“救活”

中信金融资产副总裁就位张健正式履职

美伊协议核心条款曝光：伊朗石油出口即刻解禁，核项目维持现状，海峡重启仍存变数

从“百模大战”到“百镜大战”，AI眼镜成新焦点丨一克商评

中央定调！“十五五”目标确立，未来5年养老金还会涨吗？

伦钴突破5万美元关口，出口禁令到期后刚果（金）仍未恢复出口

E句话| 李艺彤和丝芭居然和平解约了？

9月23日上市全新问界M7以全面进化回应所有期待