关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro169人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

李连杰讲述病情:62岁生日时发现颈部肿块 确定是良性

鲁中晨报 浏览 395

埃迪-豪7次面对伯恩茅斯场均积分0.7分,仅比对阵曼城、红军更多

直播吧 浏览 282

从港股GPU第一股看壁仞科技的价值新论

互联网那些事 浏览 1085

向太怒骂范冰冰经纪人,众星力捧向佐的《封神》,她却耍大牌

不八卦会死星人 浏览 314

NCAA常规赛:俄勒冈85-88失利,林葳14中8砍新高23分+三分绝平

懂球帝 浏览 186

业主私挖300平地下室:白天用挖机挖 半夜偷偷运土

扬子晚报 浏览 276

美无人机出现在委内瑞拉近海

北青网-北京青年报 浏览 190

诺和诺德再现高层震荡!董事长等7名高管将集体离职,近一年市值蒸发超千亿美元

时代周报 浏览 1584

中国人寿前三季归母净利润超1678亿元,高基数基础上同比增60.5%

证券市场周刊 浏览 1055

黄仁勋:中国军方才不会用美国芯片,人家有这能力

观察者网 浏览 561

媒体:特朗普2.0亚洲"首秀" 重中之重还是与中国有关

上观新闻 浏览 288

芦哲:人民币汇率是否会升破7.0?

首席经济学家论坛 浏览 998

西媒:迈阿密国际有意洛塞尔索,已向其表达强烈兴趣

懂球帝 浏览 191

让男人上头的“伟哥”,遭遇大败退

花朵财经 浏览 1163

记者:佛罗伦萨球员不满基恩500万高薪,后者态度也存在问题

懂球帝 浏览 194

茅台跌落价格神坛!53度飞天茅台补贴价跌破1700元,释放信号明显

火山诗话 浏览 1468

特朗普:已与普京就结束俄乌冲突方式基本达成共识

财联社 浏览 371

芦哲:降准降息利好哪些权益资产?

首席经济学家论坛 浏览 1513

44岁TVB男星再当爸,港姐太太二胎诞下小儿子

TVB剧评社 浏览 240

泽连斯基身着定制服饰重返白宫 乌设计师揭秘一处细节

环球网资讯 浏览 477

全球连线|权威访谈:携手迈进更加美好的“数智未来”——访世界互联网大会副理事长高锐

新华社 浏览 271
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4