关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者396人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者实测 多地办理电话卡需提供无犯罪证明和银行流水

澎湃新闻 浏览 338

有望首次入选全明星的球员:湖人里夫斯在列 杨瀚森队友有戏

仰卧撑FTUer 浏览 326

戴伟浚:我肯定憋着一股劲,要在深圳新鹏城证明自己

懂球帝 浏览 244

她17岁生子,居然生了个首富,烂牌打成王炸

Yuki女人故事 浏览 528

项立刚再批罗永浩!为搞流量煽动舆论,被封就是活该

雷科技 浏览 272

高盛建议高配中国股票,4000点会是A股牛市的新起点吗?

郭施亮 浏览 867

五一档三部电影扑街,《10间》格外尴尬

阿裤趣闻君 浏览 96

不满美威胁 格陵兰岛自治政府总理:我们未来自己决定

环球网资讯 浏览 282

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 396

五六十岁阿姨别瞎打扮,遵循这3个穿衣优雅的套路, 大方体面

静儿时尚达人 浏览 720

西汉姆联助理教练帕科·赫梅斯澄清与努诺·埃斯皮里托·桑托的场边争执

绿茵情报局 浏览 243

37岁生日变冷清,杨颖人设崩塌后的人情冷暖

花语舞者 浏览 181

AI改变金融系统,周小川、肖远企发声

中国基金报 浏览 372

一句话点评9月纯电车型:小米YU7反超SU7,下一步追赶Model Y?

汽车公社 浏览 392

已12年不败!曼联近12年英超主场从未输给切尔西,5胜7平保持不败

直播吧 浏览 385

今年冬天一定要有“格纹单品”,复古又时髦

LinkFashion 浏览 296

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 334

高市早苗成功"策反"对手 分析称其当选首相几乎成定局

红星新闻 浏览 378

詹卢卡-曼奇尼已为罗马打进21球,为队史进球第二多的后卫

懂球帝 浏览 87

刘嘉玲好敢说!问柯淳不谈恋爱生理没需求么?柯淳回答堪称教科书

娱乐圈笔娱君 浏览 383

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技 浏览 479
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4