关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技360人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马景涛女友称不在乎26岁年龄差,“硬刚”前任?

文娱没有圈 浏览 413

女子酒后与妹妹因清理狗屎起争执 将2只狗从21楼扔下

都市快报橙柿互动 浏览 369

委内瑞拉向中俄伊寻求导弹 外交部回应

澎湃新闻 浏览 236

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元 浏览 271

笔在手中,镜头是新墨水

上观新闻 浏览 238

1胜2负,曼城上一次在英超联赛前3轮输2场还是04-05赛季

懂球帝 浏览 381

雷军大动作!小米新车,增加机械门把手

财通社 浏览 1236

精锋医疗明日上市:募资12亿港元 腾讯与中东资本加持

雷递 浏览 166

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 206

黄安称歌手千百惠病逝 她曾晒出大陆身份证

南方都市报 浏览 412

外媒:美对华威胁加税100% 极限施压报复北京近期举动

环球网资讯 浏览 281

限时补贴价28.99万起 2026款传祺向往M8上市

网易汽车 浏览 175

周涛名后抛弃初恋丈夫,转身嫁给富商

虾说扒道 浏览 393

这样选出来的裙子,绝对不会闲置

黎贝卡的异想世界 浏览 420

九三阅兵 具体安排来了

新华社 浏览 312

美方拟禁止中国航司飞越俄罗斯领空 中国航司联名回复

澎湃新闻 浏览 264

60岁的张曼玉又美上热搜,她的珍珠搭配太值得借鉴了

LinkFashion 浏览 354

官方出手,这一次谁也救不了狂妄自大的张雪峰?

小娱乐悠悠 浏览 191

雷恩vs欧塞尔:恩博洛、塞科-福法纳首发,西纳约科、易卜拉欣-奥斯曼出战

懂球帝 浏览 273

意大利将投入135亿欧元建桥 成本纳入北约军费

环球网资讯 浏览 378

今年秋天,穿得越放松越好看!

LinkFashion 浏览 412
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4