关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro93人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郭晶晶就个人发展问题最新发声

新民周刊 浏览 239

全球牛肉“通胀”,中国市场价格为何“独稳”

北京商报 浏览 876

新势力比传统车企更乐观,2026年车市充斥着哪些挑战?

汽车头条APP 浏览 66

续航超1450km/座舱升级 全新GL8陆尊开启预售

网易汽车 浏览 381

小米YU7内掏出不明零件最新进展 市监局介入处理

网易汽车 浏览 238

视帝扛起大旗,终于有90后当主角的年代剧了

娱乐圈笔娱君 浏览 81

李嘉格点赞祝车澈越来越好,和男友冰岛过生日

眼底星碎 浏览 85

央视公开“点名”孙俪,原来张艺谋没说错

银河史记 浏览 206

丹麦增兵格陵兰岛 欧洲多国派兵

央视新闻客户端 浏览 87

何美延玩游戏都会生气,连Anson都对她应激了

老吴教育课堂 浏览 118

美财长挑拨中阿关系称"米莱要将中国赶走" 阿根廷回应

澎湃新闻 浏览 238

特朗普:将与普京“试探性会晤” 告诉他结束战争

每日经济新闻 浏览 362

“魏桥系”635亿并购冲刺,张波家族能否稳居中国十大富豪?

野马财经 浏览 1042

郝蕾澄清亲口澄清:压根不是说她

ETtoday星光云 浏览 138

50+女人的穿衣指南:亮一点,松一点,美得比年轻姑娘有味道

静儿时尚达人 浏览 368

白俄罗斯国防部长:边境出现“前所未有”军事集结

环球网资讯 浏览 91

《哪吒2》海外票房破亿元 总票房突破127亿元

每日经济新闻 浏览 618

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 1033

售16.59万元起 改款奥迪A3家族正式上市

网易汽车 浏览 234

"世界第一美少年"去世 女儿未透露其具体死因

扬子晚报 浏览 191

业余球手夺一球致胜冠军!高芙贡献名面,周杰伦球都没碰到就出局

网球之家 浏览 88
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4