关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者216人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泽连斯基愿意在与普京的会晤中讨论领土问题

界面新闻 浏览 411

“玛丽珍鞋”今年秋天爆火!这5双怎么搭都好看

LinkFashion 浏览 475

胡塞武装宣布:打掉隶属美以沙三方间谍网络

环球网资讯 浏览 343

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 395

世体:尽管知道需合理分配体能,但莱万不会放弃争夺中锋位置

懂球帝 浏览 271

看完《731》,心情很复杂

独立鱼 浏览 484

记者问美防长戴"俄国旗颜色领带" 五角大楼:你妈买的

环球网资讯 浏览 420

企业悬赏百万征集公职人员违法线索 对方起诉索赔百万

极目新闻 浏览 523

朱广权喊风神放手一搏,风神L8限时置换价11.39万元起

网易汽车 浏览 429

山姆变盒马?500万中产抵制“阿里味”

花朵财经 浏览 1220

今年夏天最流行的衣服竟然是它?高级又好看!

LinkFashion 浏览 42

如鱼得水!福克斯半场10中5得13分5板4助1断1帽 得分暂全队最高

直播吧 浏览 615

深圳福田“场景超市”上新,打造AI落地“超级接口”

南方都市报 浏览 399

OPPO AI战略曝光!全场景、全链路,要把 AI 做成系统?

雷科技 浏览 378

陈道明被王家卫说他是阴阳同体的极品

包饺子ai剪辑 浏览 399

有了AI,课堂如何“教”与“学”?

看看新闻Knews 浏览 384

谷歌推出开源全栈NPU新架构,旨在实现大模型在终端的低功耗运行

DeepTech深科技 浏览 376

哈马斯证实其军事领导人辛瓦尔已死亡

极目新闻 浏览 485

荣梓杉塌房太离谱!出轨家暴还反咬?

东方不败然多多 浏览 357

NBA战报:灰熊141-125热火,阿德巴约23分

懂球帝 浏览 366

苗青:光伏“破局者”的周期穿越法则

中国企业家杂志 浏览 1272
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4