关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro239人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日本平台征集"批评中国"视频每条180元 日本网民炸锅

极目新闻 浏览 281

罗马诺:尤文等5队有意明格萨,塞尔塔目前不想将其出售

懂球帝 浏览 224

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 386

卷首语 | 拒绝和解的勇气

时尚COSMO 浏览 364

齐溪自曝二胎是女儿,二胎已经满一岁了,41岁生二胎原因好暖心

扒虾侃娱 浏览 356

2025成都车展:福特智趣烈马亮相 可选增程或纯电

太平洋汽车 浏览 491

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 591

太阳&水星和本地转播商提前续约 新合同年价过3000万美元

直播吧 浏览 445

篮协主席:中国男篮这个团体很可爱,无论未来输赢要把拼搏和团结保持住

懂球帝 浏览 528

双向奔赴!澳优乳业再度携手江南大学 为营养健康行业发展注入创新动能

中国商报 浏览 1261

国米官方:劳塔罗当选球队12月队内最佳球员

懂球帝 浏览 211

住户睡觉没拔充电器家被烧 一两分钟火苗蹿到天花板

极目新闻 浏览 378

被截胡,赫塔费主席曾称谈妥了穆尼奥斯,但球员去了奥萨苏纳

懂球帝 浏览 671

高市早苗当选首相的"助攻手" 重点提携了"汉奸"石平

极目新闻 浏览 359

以军总参谋长:将“以最佳方式”执行接管加沙城任务

国际在线 浏览 482

“2025全球十大工程成就”揭晓,DeepSeek开源大模型等上榜

上观新闻 浏览 403

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 400

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 301

“大衣+运动鞋”才是冬天最时髦搭配,这样穿松弛又减龄!

LinkFashion 浏览 233

跨年档12部新片来袭!没有大片全是情怀,55岁古天乐对打71岁成龙

萌神木木 浏览 280

北京越野BJ40增程赤兔版 续航超过1200km

隔壁说车老王 浏览 219
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4