关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位3446人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

克洛普:瓜迪奥拉让我变得更好,面对他我战绩不错但不知如何发生

直播吧 浏览 3633

西汉姆联2-2伯恩利,英斯、帕奎塔破门,福法纳轰世界波

懂球帝 浏览 3382

部委干部被美国CIA人员策反 多次秘密接头收取经费

国家安全部 浏览 5879

最近这件衬衫很火 一定要试试这样穿

她暖 浏览 8074

美国要向乌克兰援助巡逻艇,俄媒:美军不想要的

环球军事时报 浏览 17010

第三次动脸了吧?她是怎么瞒天过海的?

新氧 浏览 6937

一文看懂副业真相,斜杠青年赚钱吗?

钛媒体APP 浏览 8177

月薪2万,吃不起一顿麻辣烫

市界 浏览 7574

张丹峰洪欣离婚后续:儿子改母姓 洪欣露面状态好

叶公子 浏览 9935

传中芯国际获美供应商供应许可,主要涵盖成熟工艺

爱集微 浏览 17605

阿尔特塔:我们对夏窗有清晰的规划;不会现在谈论伊万-托尼

懂球帝 浏览 3643

乌军要从巴赫穆特撤退?乌官方:将继续防御

环球网资讯 浏览 10549

古尔曼:苹果今年WWDC不会推出类似于ChatGPT的竞品

IT之家 浏览 10363

八年生4胎,稳坐豪门阔太宝座,“千亿儿媳”徐子淇真不简单!

娱乐白名单 浏览 129

默多克五婚妻子是分子生物学家 前夫女儿都是亿万富豪

红星新闻 浏览 20870

11月豪华品牌 :旧王朝坚如磐石 新秩序仍需时间发酵 |汽势焦点

汽势传媒 浏览 4211

不愧章子怡,竟瞒着他做出这么吓人的事

Yuki女人故事 浏览 2262

47岁的黄晓明,终于“开窍”了

皮皮电影 浏览 2002

沃克25+6绿军险胜快船3连胜 乔治32分塔图姆16中5

网易体育 浏览 17805

港媒曝霍启刚病情加重昏迷住院!郭晶晶带长子陪床

万鸣说娱乐 浏览 7289

村民拒绝自家土地流转提出质疑 副镇长:有多远滚多远

燕赵都市报纵览新闻 浏览 43057
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4