关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者333人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普被指一边喊一边咒骂 让乌方把顿巴斯地区给俄方

红星新闻 浏览 371

让大模型能自己想出安全方案——KAIST团队的突破性研究

科技行者 浏览 253

零百2.5s 纯电保时捷Cayenne Turbo新车图解

车质网 浏览 276

五菱缤果S内饰曝光 换大屏大面积软包

网易汽车 浏览 486

特朗普强调美以两军配合默契:以装备并操作大量美制武器系统

极目新闻 浏览 147

杨振宁和她的53年婚姻,是这样的

Yuki女人故事 浏览 359

中国加速构建具身智能数据标准体系 “浦江X”平台发布

上观新闻 浏览 454

这次结果如何?切尔西上次在1月换帅后拿了欧冠

懂球帝 浏览 293

吴向东一场前所未见的白酒直播,亮出珍酒李渡的里子和面子

斑马消费 浏览 5849

iPhone 17量产郑州富士康招工 求职者:3个月能赚2万多

每日经济新闻 浏览 559

金价多空拉锯,“黄金+”还靠谱吗?

第一财经资讯 浏览 11310

空客天津第二总装线投产,高端航空制造产业集群成型

华夏时报 浏览 349

余嘉豪:扣完篮肾上腺素就上来了,但得马上冷静继续投入比赛

懂球帝 浏览 319

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 334

日方鼓吹拥核 国防部表态

环球网资讯 浏览 253

安徽凭什么抢走“汽车第一省”王座?

盖世汽车 浏览 504

五角大楼启动10亿美元新计划 采购数十万架单向攻击无人机

环球网资讯 浏览 278

专家:俄乌走向取决于特朗普态度和美欧关系会否破裂

中国新闻周刊 浏览 598

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 1598

纯电续航751km 奥迪E7X将于5月8日预售

车质网 浏览 60

九三阅兵 具体安排来了

新华社 浏览 407
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4