关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位3876人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章

华尔街见闻官方 浏览 113

我国最“不靠谱”专家,公开在央视“忽悠”人

来科点谱 浏览 100

销量、价格双双坍塌,二线豪华品牌,已经被国产新能源“挤垮”了

小李车评李建红 浏览 152

双星名人创始人父子决裂 父亲称被儿子扣工资借钱维生

极目新闻 浏览 113

欧豪:16岁送外卖,21岁遇到贵人谢霆锋

韩驰 浏览 121

脱口秀演员杨笠清空社交账号 她到底经历了什么?

代军哥哥谈娱乐 浏览 205

稀土是啥?为啥是中国王牌?

混知财经 浏览 385

华为计划2027年实现城区L4规模商用

观察者网 浏览 414

国企6382.5万买沥青变"水和空气" 沥青是否存在过成谜

上游新闻 浏览 227

包钢板材厂爆炸工人被气浪掀飞 一铁球飞射砸塌二层楼

上游新闻 浏览 89

复星医药14亿元押注停产药,其疗效问题饱受市场争议,公司回复监管函

红星资本局 浏览 4021

徐帆带徐朵参加活动,徐朵发文回应质疑

无处不风景love 浏览 89

谁说何老师老了?!

时尚COSMO 浏览 220

拥抱变局!2025外滩年会揭幕,聚焦新秩序、新科技

国际金融报 浏览 1222

委内瑞拉:逮捕一批"掌握美情报机构直接信息"的雇佣兵

红星新闻 浏览 203

外媒:泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 244

不露腿也想穿好看,最关键的是这一点

黎贝卡的异想世界 浏览 80

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

上观新闻 浏览 94

奇瑞QQ3纯电版要来了 轴距2700mm

网易汽车 浏览 95

又一国产车企官宣:正式全面停产、停售燃油车!

电动知家 浏览 88

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 248
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4