关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者285人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

极简风格配多功能扩展孔位 零跑B10内饰谍照首曝

网易汽车 浏览 544

豆包未成年人模式上线 短视频终于可以关了

网易科技报道 浏览 309

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 4983

21.99万元起买华为满血智驾/鸿蒙座舱 岚图FREE+来了

网易汽车 浏览 444

空客天津第二总装线投产,高端航空制造产业集群成型

华夏时报 浏览 256

东风集团将退市 岚图汽车将独立上市

网易汽车 浏览 360

影响巨大,这是中国电影英雄叙事的绝佳典范

幕味儿 浏览 393

跨军种联合 直击空军航空兵直升机海上着舰训练

环球网资讯 浏览 283

41名ATP人员被困迪拜梅总打趣来场闭门赛,周意发文称成战地记者

网球之家 浏览 95

2026款宋Pro DM-i上市 限时超级优享价9.98万元起

只懂车 浏览 153

记者:成都是最国企的俱乐部,现在应关心周定洋和莱切特续约

懂球帝 浏览 209

苹果发布第二代Vision Pro开发者连接带,传输速率提升至20 Gbps

IT之家 浏览 283

美国在委内瑞拉附近水域拦截第三艘油轮

界面新闻 浏览 191

香港火灾现场明火已逐渐被扑灭 消防员将开始上楼搜救

每日经济新闻 浏览 232

超频三 RT620Pro TC ARGB 风冷 239 元上市,配备家族化一体顶盖

IT之家 浏览 262

立案!光环下的清越科技,藏着多少“秘密”?

财经下午茶 浏览 1183

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 247

俄称打击乌军多处目标 乌称击退俄进攻

国际在线 浏览 291

白银LOF变成了一种分级B

远川聊资管 浏览 949

置换价17.99万起 奇瑞风云T11正式上市

网易汽车 浏览 275

再一次分别,刘军帅告别李霄鹏:感谢这一生遇到最好的教练

懂球帝 浏览 193
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4