关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者392人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被许家印坑得最惨的大佬,资产清零了

大猫财经Pro 浏览 2227

皮尔斯:詹姆斯有着大前锋身材&后卫打法 他身材和大本一样

直播吧 浏览 424

逍遥大结局:看到最后,这个曾经最可恨的妖,却是全剧喜剧人之首

肆季娱乐 浏览 225

何超莲晒全家福,三太瘦了很多,窦骁仍缺席

素素娱乐 浏览 29

万斯警告泽连斯基:不要说特朗普"坏话" 会适得其反

环球网资讯 浏览 778

美ICE当街打死一人 施救医生:特工忙着数他身上的弹孔

红星新闻 浏览 211

国家互联网应急中心提示“龙虾”风险

澎湃新闻 浏览 166

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 416

6次夺回球权!田中碧当选英超首轮利兹联队内最佳球员

直播吧 浏览 495

香港科技大学发现图片压缩优化AI内存效率

科技行者 浏览 360

7万+再创造车新势力月销纪录 零跑或成下一个中国前十

道哥说车 浏览 363

瞬间暴跌40%,东方甄选到底怎么了?

财经锐眼 浏览 3028

联合国官员:加沙惨状如末日电影

上观新闻 浏览 375

芦哲:人民币汇率是否会升破7.0?

首席经济学家论坛 浏览 1087

成龙满嘴谎话?却被兄弟公开指责吝啬人品差?

小娱乐悠悠 浏览 370

伊姐周日热推:电视剧《吴邪私家笔记》;电视剧《灼灼韶华》......

伊周潮流 浏览 435

韩国特使离开北京 中方提出一个要求李在明口风变了

梁讯 浏览 515

2026年AI赛道群雄逐鹿,跨国车企巨头如何摆兵布阵?

禾颜阅车 浏览 225

魏牌9年换9帅,魏建军:他们自己感觉压力大

雷达财经 浏览 286

短剧一哥易主,陈添祥跌出排名,榜首实力太强

喜欢历史的阿繁 浏览 48

司晓迪怒斥周奇脚踏两条船,近期还约她见面,网友喊话向涵之快跑

萌神木木 浏览 284
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4