关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者46人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"台独"分子沈伯洋十分担忧求助台陆委会:不敢离开台湾

看看新闻Knews 浏览 69

铁了心扳倒GL8!直降4万3,双层玻璃+大7座,油耗5L,还要啥比亚迪?

隔壁说车老王 浏览 4194

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 2467

《孤注一掷》票房超《封神》 张艺兴跳鬼畜舞庆祝

萌神木木 浏览 6497

关掉1000家门店!通用汽车通过收购将别克品牌经销网络削减一半

网易科技报道 浏览 4333

谷歌因未支付先前罚款而再次被俄罚款

界面新闻 浏览 7334

国产汽水50年:健力宝"王者沉沦" 老汽水品牌纷纷复出

鬼谷子思维 浏览 66711

2026款奔驰EQE上市 售价47.8-62.7万元

车质网 浏览 21

特朗普下令美重启核试验 打开潘多拉魔盒的危险一步

澎湃新闻 浏览 72

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 14

瓦格纳电报频道发文:普里戈任被"叛徒"杀害

潇湘晨报 浏览 6201

20岁身价5000万欧!卫报:因被阿莫林边缘化,梅努想要离开曼联

直播吧 浏览 219

海哈金喜控诉李亚鹏大男子主义,他的老毛病又犯了

甜小娱儿 浏览 8356

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 101

迈凯伦新专利 赛道模式将锁定使用场景

车质网 浏览 9

排队两小时买奶皮子糖葫芦,值吗?

时尚COSMO 浏览 56

芬兰在芬俄边境开建200公里防护栏:3米高 配夜视仪

澎湃新闻 浏览 10852

童瑶和老公聚餐被拍,路边抽烟姿势老练

古希腊掌管月桂的神 浏览 243

澎湃思想周报|当AI开始“反犹”;注意力经济在吞噬Z世代

澎湃新闻 浏览 394

节后,最想穿红靴子去上班!

Yuki女人故事 浏览 4241

澳专家:我害怕的是对中国的无知

环球时报国际 浏览 225
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4