关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者105人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

累瘫?三战全打满40分钟 从40+9到11+5失误 黑龙江女战神也顶不住

颜小白的篮球梦 浏览 286

延世大学团队发现LLM思维路径的"均匀信息密度"密码

科技行者 浏览 206

日均不到1000元机器人带回家?智元为机器人租赁市场带来“令人心动的offer”

时代财经 浏览 268

极氪8X实车现身,大过宝马X5+5/6座可选,配1401马力+双腔空悬?

燕赵女司机 浏览 135

舍伍德:大家都想看枪手掉链子,但我真希望他们赢得英超冠军

懂球帝 浏览 181

KTV消亡史:卡拉还O不OK了?

时尚COSMO 浏览 402

南部战区:正告菲方停止在南海挑起事端

北京日报客户端 浏览 296

周定洋社媒庆祝绝平申花:让我们继续拼、继续冲,一场一场来!

直播吧 浏览 328

荷媒:阿贾克斯希望租借津琴科,已与阿森纳基本达成一致

懂球帝 浏览 131

塔帅:赢球能带来能量和信心,我觉得这是足球最重要的两件事

懂球帝 浏览 132

斯基拉:那不勒斯预计近期与梅努经纪人进行新的直接会谈

懂球帝 浏览 178

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

Yuki女人故事 浏览 88

63.3度电池+60L油箱 小鹏X9增程版续航1602公里

网易汽车 浏览 270

又离了!李亚鹏得名“八离世家”

Yuki女人故事 浏览 274

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 278

AI+HR ,促进人力资源服务业高质量发展

文汇报 浏览 387

今年春天的半裙,很“牛”!

Yuki女人故事 浏览 60

特朗普强调美以两军配合默契:以装备并操作大量美制武器系统

极目新闻 浏览 39

梦天家居紧急刹车

富凯财经 浏览 3163

离婚6年,文章同样的“招数”,让她跌倒了两次?

趣文说娱 浏览 387

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 233
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4