关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro238人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奇瑞QQ3量产版曝光! 轴距2米7配8155芯片

Ai爱车 浏览 271

比亚迪唐9系旗舰SUV测试 要从BBA嘴里"抢肉吃"?

车矩阵更懂车 浏览 247

Qwen3.7-Plus上线

财闻 浏览 18

打不开的车门 小米SU7 Ultra成都交通事故细节详解

网易汽车 浏览 173

欧洲高颜值王室访华:曾与高中老师结婚 二婚嫁入王室

上游新闻 浏览 320

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 379

媒体:中方反制日自卫队前高官 令人想起"白团"终失败

新民周刊 浏览 312

泽连斯基:俄武器含美中英德日韩零部件

澎湃新闻 浏览 402

15万也能开出头等舱质感,试驾锐胜M8

只懂车 浏览 273

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 1596

专访苹果副总裁:一个小红书博主,该用什么样的苹果工具?

爱范儿 浏览 239

知名女星私生活的谣言有多离谱?

动物奇奇怪怪 浏览 395

“开门红”同比增长27% 零跑汽车1月交付32059台

网易汽车 浏览 239

黎巴嫩总统谴责以军空袭贝鲁特

上观新闻 浏览 346

涉结束俄乌冲突 美媒披露"12点方案"

环球网资讯 浏览 351

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 176

44岁前TVB花旦有望跟前未婚夫复合

探长影视解说 浏览 298

吉利ICON巧克力心动紫上市!网友:销量稳了

汽车网评 浏览 366

双剑合璧:科创板、创业板的重大改革与长期投资价值

尺度商业 浏览 2712

锂电行业“反内卷”持续推进,四部委:坚决抵制不合理、不正当竞争行为

澎湃新闻 浏览 139

强奸大嫂凶手出狱去大嫂家 大嫂吓得穿内衣跑街上求救

澎湃新闻 浏览 235
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4