关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者213人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华为与广汽“联姻”升级“启境”能否成为高端市场新王牌

大象新闻 浏览 259

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 153

NewmindAI突破:双路径训练实现AI精准理解土耳其法律

科技行者 浏览 57

111年来首现美总统炒掉美联储理事 美元指数立即下跌

红星新闻 浏览 329

北航团队突破:让AI学会像人一样思考,不必每次都说出来

科技行者 浏览 60

普京:调解乌克兰危机的基础是消除其成因

国际在线 浏览 355

“史上最强”半年报,零跑汽车达成半年度盈利新里程碑

汽车网评 浏览 348

“车圈拼多多”盈利了,零跑汽车股价翻倍市值千亿

达摩财经 浏览 2248

赵丽颖新剧收视走势差,表演短板全暴露,后续没存货半年没进组

萌神木木 浏览 105

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 124

官方:张效瑞出任梅州客家总经理,莱蒂耶里担任主教练

懂球帝 浏览 67

伊姐周日热推:电视剧《生命树》;电视剧《风过留痕》......

伊周潮流 浏览 73

坦克300泰国版外观酷似“大G”!预计售价亲民,搭载2.4T柴油+9AT

小史谈车 浏览 60

媒体:野田佳彦看到机会要对高市下手 高市有可能下台

新民周刊 浏览 79

初秋穿什么才最适合?准备好以下这些单品,日常穿衣不再发愁

静儿时尚达人 浏览 316

推广|| 你们千呼万唤的“神裤”终于返场了!

黎贝卡的异想世界 浏览 573

第十届四川省大学生机器人大赛在蓉开幕 全省51所高校614支战队硬核对决

红星新闻 浏览 249

8个月前碰撞损伤仍未修复 美"杜鲁门"号航母新照披露惹争议

环球网资讯 浏览 218

毛茸茸的冬天,毛孩子们都在想什么?

时尚COSMO 浏览 129

女子143万购铺想靠租金养老 发现月租虚高解约被索赔

封面新闻 浏览 386

"苦情"首相白了头 柬埔寨首相洪玛奈的夫人走向台前

现代快报 浏览 320
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4