关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者286人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前三季度GDP增速暂居全国首位,湖北挑战“中部第一省”

时代周报 浏览 1277

“沙僧”刘大刚去世!生前最后露面消瘦,去年师徒合体表演成绝唱

萌神木木 浏览 274

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超 浏览 132

年度总结|| 2025年学会的8件小事

黎贝卡的异想世界 浏览 167

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者 浏览 273

Win10用户纷纷转向Linux!Zorin OS称72%新下载来自Windows

快科技 浏览 262

外卖“烧钱”没有赢家

北京商报 浏览 1070

丈夫拦停撞妻逃逸者反遭40万巨额索赔 法院判了

新民晚报 浏览 422

微胖入秋别这么穿!显胖又土气,真的太丑了!

Yuki女人故事 浏览 441

宽基ETF被抢筹,市场风格走向何方?

国际金融报 浏览 1745

美军绑架马杜罗"原班人马"全部飞抵欧洲 新目标已浮现

依偎在角落 浏览 168

帕克怒喷奥纳纳:他甚至都算不上门将,这些人到底谁找的?

直播吧 浏览 407

缅北四大电诈头目被押解回国 特写画面首次披露

大风新闻 浏览 145

北京越野BJ30旅行家 7座方盒子重塑轻野出行

网易汽车 浏览 390

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 306

还是这些穿搭适合初春季节!外套不多买、常穿裙子,优雅舒适

静儿时尚达人 浏览 19

美联储理事米兰再次呼吁加快降息,断言“潜在”通胀接近目标,称任期或延长

华尔街见闻官方 浏览 2780

英伟达入股英特尔

北京商报 浏览 375

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 249

董璇对谁是生理性喜欢?看她分别和高云翔、张维伊的合影就知道了

娱乐圈笔娱君 浏览 348

第一女富豪的大瓜,被拍出来了

独立鱼 浏览 317
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4