关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者394人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

将于北京车展首发 奕境旗下首款量产车路试谍照曝光

网易汽车 浏览 264

上映27天被观众赶出院线!网播也救不了它,事实证明烂片已无市场

娱乐圈笔娱君 浏览 247

「以演聚力·链动共生」文旅商体展融合专场私董会成功举办!| 2025文创新势力超级私董会

第一财经商业数据中心 浏览 1585

粗腿救星!“仙女裤”火了,比奶奶裤更显时髦!

Yuki女人故事 浏览 512

一周AI大事:谷歌Gemini学会“接管”你的电脑、马斯克机器人被手卡住了

网易科技报道 浏览 403

格力再强调暂无铝代铜计划!铝和铜各方面存在较大差距

快科技 浏览 206

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 423

特朗普:俄方知道美国在俄海岸附近部署核潜艇

环球时报 浏览 342

女子连续偷吃5个蛋挞 转身大摇大摆走掉

极目新闻 浏览 484

股市:开门红

小白读财经 浏览 1448

清华新作ControlAudio:声音何时响、说啥话?都能按剧本可控生成

机器之心Pro 浏览 127

今日起,数字人民币开始计息,这些变化影响你的钱包

红星资本局 浏览 2570

小米“巨省电”,为何又是一波大争议?

正经社 浏览 1172

钢铁业未见“金九银十” 中钢协呼吁“自律控产”

中国经营报 浏览 2221

这类ETF单周缩水超2000亿元,发生了什么?| ETF规模周报

每经牛眼 浏览 1091

吴建豪:一位复古“老餮”的用心律动与生命赤诚

三石一声 浏览 228

极越汽车或迎新生机!

电动知家 浏览 318

外观方正硬朗 三菱全新SUV预告图曝光

车质网 浏览 276

媒体:特朗普"急踩刹车"与伊朗停火 以方声明流露不满

新民晚报 浏览 139

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 258

辟谣后,东方甄选一度涨超14%

第一财经资讯 浏览 519
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4