关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者217人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白百何好友下场了!揭露争奖细节,放话大不了鱼死网破电影不上了

萌神木木 浏览 345

斯基拉:前米兰队长卡拉布里亚想回意甲,索要200万欧年薪

懂球帝 浏览 258

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 304

小米SU7成都事故惨烈 "打不开的门"问题在哪儿

网易汽车 浏览 395

“小度”“小爱”能当AI老师吗?小小“数字原住民”出现“幼儿主体性”危机

上观新闻 浏览 332

跟队:拜仁内部不会轻易谈论让伦纳特-卡尔踢世界杯的话题

懂球帝 浏览 370

今年秋天最美的4件针织,怎么搭都好看!

LinkFashion 浏览 507

财务报告存在错报!联创光电及董事长被警示,此前公告董事、监事被留置

红星资本局 浏览 1050

现代IONIQ3即将全球首发 400V架构 定位小型SUV

汽车公告板 浏览 222

丹麦增兵格陵兰岛 欧洲多国派兵

央视新闻客户端 浏览 226

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 369

南部战区107编队演训影响几何 专家解读

上观新闻 浏览 96

上海优化政策释放住房消费需求

商业观察杂志社 浏览 2120

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 376

26款丰田皇冠陆放上市:新增黑金色,28.48万起

IT之家 浏览 343

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 283

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 9824

福建舰设计师团队:以80后年轻人为主

极目新闻 浏览 308

重大突破!新能源,两大利好!

券商中国 浏览 16988

抗日民族英雄吉鸿昌将军后人将参阅

极目新闻 浏览 510

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro 浏览 238
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4