关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技478人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 2185

中国9系新旗舰 长城魏牌V9X正式亮相

网易汽车 浏览 140

到底什么人还在买油车?终于我悟了

汽车公社 浏览 342

一线城市二手房挂牌量下降,2026年会迎来股市楼市齐涨的局面吗?

郭施亮 浏览 5728

优雅的性能猛兽 奥迪E5 Sportback预售23.59万起

网易汽车 浏览 516

学生想从公交前门下遭拒 轻声骂了句被司机追下车打伤

大风新闻 浏览 215

新基金业绩大分化

国际金融报 浏览 1395

哈马斯代表团与埃及官员磋商:希望恢复加沙停火谈判

国际在线 浏览 506

夏天裙子不用太多!建议每个人都准备一条波点裙,优雅显气质

静儿时尚达人 浏览 25

找到亿吨“锂矿”,也得算算经济账

汽车公社 浏览 590

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 410

“塌房失败”的李雪琴给所有人上了一课

乡野小珥 浏览 319

卷首语|这届年轻人,全员渡劫奥德赛

时尚COSMO 浏览 96

合约纠纷还没了,鞠婧祎的新剧又悬了?

八卦三缺一 浏览 261

美国电动汽车遭遇“断崖式”下跌

电动知家 浏览 384

章泽天播客翻车删帖,网友怒斥怕批评就别出门

萌神木木 浏览 255

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者 浏览 227

始祖鸟发布道歉信 但海内外版本不一致

极目新闻 浏览 445

英国以“最高优先级”正式调查社交平台X

新华社 浏览 276

抗癌不到一年,曝刘谦近况

林轻吟 浏览 386

斯基拉:阿森纳正在关注铃木彩艳,有意在下个赛季引进他

懂球帝 浏览 325
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4