关闭广告

上海交大突破:单一AI模型实现全视觉创作任务

科技行者162人阅读


这项由上海交通大学的陈俊逸、何通等研究者与快手科技Kling团队、南洋理工大学合作完成的研究发表于2026年1月,论文编号为arXiv:2601.02358v1。对于想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查询完整论文。

在当今的AI时代,我们见证了各种令人惊叹的视觉生成工具。有些能根据文字描述生成精美图片,有些能制作流畅的视频片段,还有些专门用来编辑和修改现有的视觉内容。然而,这些工具就像一个个各有专长的工匠,每个都只能完成特定的任务。如果你想要完成一个复杂的视觉项目,往往需要在多个不同的工具间来回切换,就像在不同的工作台之间搬运材料一样麻烦。

现在,研究团队带来了一个革命性的解决方案——VINO(VInO: A Unified Visual Generator with Interleaved OmniModal Context),这就像是打造了一个万能工作台,能够同时处理所有类型的视觉创作任务。这个系统最令人兴奋的地方在于,它可以同时理解和处理文字、图片和视频等多种信息,并且能在一个统一的框架内完成图像生成、视频制作和内容编辑等各种任务。

VI

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

许绍雄情况不乐观!黄宗泽低调现身,佘诗曼落泪取消行程前往医院

萌神木木 浏览 277

网友称在按摩时遭51岁技师摸下体猥亵 门店:他才来3天

大风新闻 浏览 124

迪巴拉昨日前往荷兰现场观看F1,并在社媒上晒出照片

直播吧 浏览 301

预计2026年正式发布 全新现代i20渲染图曝光

车质网 浏览 303

包贝尔老婆包文婧自曝,给儿子穿二手旧衣服

韩小娱 浏览 15

44岁TVB男星再当爸,港姐太太二胎诞下小儿子

TVB剧评社 浏览 240

E句话| 白姐从不爆假料?

仙女事件簿 浏览 253

慕尼黑车展折射中欧车企博弈

盖世汽车 浏览 356

新研究让大模型学会主动追问,人机协作效果大幅提升

DeepTech深科技 浏览 180

香港三天两夜,满载而归(附攻略)

黎贝卡的异想世界 浏览 70

阔腿裤失宠了?这4条裤子承包你整个春天的时髦!

LinkFashion 浏览 87

张柏芝不再隐瞒,三胎生父早有答案?

石场阿鑫 浏览 206

以军称打死哈马斯武器装备部门负责人

新京报 浏览 216

“有趣”的时髦,藏在穿搭里

Yuki女人故事 浏览 417

看足协杯上直播吧!视频直播预告:国安vs玉昆,刘畅/贺宇解说

直播吧 浏览 415

从一家超市的开业,看大卖场的终章

新零售财经 浏览 673

用这几件单品,轻松get秋日氛围!

黎贝卡的异想世界 浏览 325

S家族,最出名的不是八卦?

江湖人称艾掌门 浏览 291

何广智:甭管原来你是二线三线十八线,在上海都是同一起跑线

第一财经资讯 浏览 1742

京东再出重拳!联手长安设计开发新能源无人智能化车型以及城市智慧物流

封面新闻 浏览 295

顶流被说不合群,王一博冷脸背后隐藏秘密?

联友军事 浏览 395
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4