关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技383人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

医疗大健康重磅论坛,将于世界人工智能大会第3天亮相!

第一财经资讯 浏览 481

陈浩民夫妇滞留阿联酋,半夜发文怀念祖国

北纬的咖啡豆 浏览 86

古利特:皇马3个前锋无球时做的太少,贝林厄姆成为受害者

懂球帝 浏览 212

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 360

媒体:美作错误示范 未来突破"底线"的事或更频繁发生

新民晚报 浏览 175

王宁财富超马云、王传福,泡泡玛特一年赚300亿很轻松?

BT财经 浏览 817

风云起,美国又来了!针而对之小圈子呼之欲出

浏览 497

他靠演反派爆火却对同事女儿一见钟情

张发林 浏览 363

协助拦截伊朗无人机 乌克兰遭“敲打”

极目新闻 浏览 75

挪威队主帅:我们和阿森纳达成协议,厄德高不会在世预赛出场

懂球帝 浏览 245

“不死鸟”上新!丰田Hilux完成换代,造型更硬核,启用纯电动力

闻车品百魅 浏览 92

独家!张维伊婚宴真实价格曝光,人均三百元,在当地扬眉吐气了

萌神木木 浏览 362

10月第一周豪华SUV销量榜 奥迪Q5L第2/宝马X3第5

小李子体育 浏览 264

王思聪现身日本被偶遇,和新女伴逛街举止亲密,与懒懒恋情引猜测

扒虾侃娱 浏览 392

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 272

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 299

中国想通过阅兵传递什么信号 外交部回应

上观新闻 浏览 429

李斌回应受余承东邀请参加发布会:这个时代最好的车安徽造中国造

IT之家 浏览 675

女子名下房产被亲姑姑霸占近10年 最新进展来了

扬子晚报 浏览 448

五年十代攻关 浙大成功培育高锌水稻“全能选手”

环球网资讯 浏览 290

基于电动化平台打造 宾利全新SUV预告图发布

车质网 浏览 261
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4