关闭广告

字节跳动OmniHuman:静态照片秒变生动视频

科技行者500人阅读


音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月发表了一项名为"OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models"的重要研究成果,该研究由字节跳动的林高杰、姜建文、杨佳琦、郑泽荣、梁超等研究人员共同完成,已发表在arXiv平台(论文编号:arXiv:2502.01061v3),有兴趣深入了解的读者可以通过https://omnihuman-lab.github.io/访问项目详情。

这项研究解决了一个普通人都能理解的问题:如何让静态照片中的人物"动起来"。以前,制作一个人物说话或唱歌的视频需要复杂的设备和专业技术,现在只需要一张照片和想要的音频内容,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥巴马意外现身 庆祝胜利

参考消息网 浏览 312

冯仑:兄弟管公司,女朋友管章子,「江湖人」的企业往往都死得快

冯仑风马牛 浏览 761

杨超越最新状态曝光!身材颜值全满分!

草莓解说体育 浏览 398

民调显示:相较美国,加、德、法、英四国民众更信赖中国

环球网资讯 浏览 17396

AI时代存储“超级牛市”降临?透视A股存储核心产业链掘金逻辑

时代周报 浏览 882

李在明:韩美贸易谈判僵持 美不能给韩带来灾难性后果

新京报 浏览 368

哥大新方法:频率指纹揭示AI数学思维盲点

科技行者 浏览 339

人工智能的财富潮水,开始向“瓶颈”处流动

锦缎研究院 浏览 6313

保障泰山vs国安比赛的球迷出行,济南公交推出11条球迷专线

直播吧 浏览 503

新势力们可以摸着韩国车的石头过河,从帕里斯帝上可以学到什么?

驾仕派 浏览 465

伊拉克国防部:已全面接管阿萨德空军基地

极目新闻 浏览 244

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 268

能当PC用的平板电脑!小米平板8 Pro测评:骁龙8至尊打造的安卓平板生产力天花板

快科技 浏览 461

传美国入股?台积电不予置评

看看新闻Knews 浏览 482

四个月内两高管遭留置 富森美称与上市公司无关

中国经营报 浏览 5131

牛弹琴:点名指责索罗斯在美搞颜色革命 特朗普很生气

上游新闻 浏览 492

75岁斯琴高娃近况曝光令人担忧!暴瘦

小徐讲八卦 浏览 301

增收不增利 三只松鼠求解成本难题

北京商报 浏览 773

杨鸣:北控伤病多比赛结果不能作参考,魔鬼三连客大家要保持专注

懂球帝 浏览 251

三年半亏掉62亿,244亿大模型巨头剑指港股

雷达财经 浏览 282

BIO-FORUM 2025 蓄势待发|聚焦生物医药前沿技术,共建全球创新合作生态

上观新闻 浏览 352
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4