关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者248人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新东方员工再出新歌"骂"公司 俞敏洪曾奖励12万

界面新闻 浏览 383

美媒:美正向中东增派包括航母在内的兵力

界面新闻 浏览 229

汪小菲一家已回台北,小杨阿姨还在北京直播

春序娱乐 浏览 579

五到十二:财务管理不善如何将狼队置于危险境地

绿茵情报局 浏览 230

这谁能想到!能伸手“救”日产汽车一把的,会是比亚迪

小李车评李建红 浏览 363

云业务继续狂飙!甲骨文与Meta洽谈200亿美元AI云计算协议

华尔街见闻官方 浏览 2271

董路:日本队6届世界杯过不了16强 跟国足24年无缘世界杯一样痛苦

风过乡 浏览 370

犯罪团伙大胆却“业余”,珠宝黑市隐蔽且暴利,FBI前探员拆解卢浮宫劫案

环球网资讯 浏览 986

泽连斯基:与美国的谈判并不容易

新华社 浏览 318

《寂静的朋友》全亚洲登陆,梁朝伟出演大尺度镜头,很可能被删减

最爱酷影视 浏览 351

永辉胖东来式调改店+1,盐城首店开业

新零售财经 浏览 1153

约基奇前三节20中9得25分12板7助1断1帽 14次三分出手创生涯新高

直播吧 浏览 620

U17世界杯吉祥物灵感来自前国足主帅米卢,米卢:感谢这个创意

懂球帝 浏览 344

特朗普称批准韩国建造核潜艇

澎湃新闻 浏览 343

普京:俄罗斯对任何国家都不构成威胁

央视新闻客户端 浏览 337

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 222

"苦情"首相白了头 柬埔寨首相洪玛奈的夫人走向台前

现代快报 浏览 501

赵丽颖好事将近?闺蜜给她的生日祝福好微妙,被怀疑恋情有新进展

萌神木木 浏览 364

职业老炮入局,中炬高新刮骨疗伤

斑马消费 浏览 1185

8.88万起售 还带8155芯片与L2辅助驾驶

My车轱辘 浏览 422

是到了该聊聊今年北影节的时候了

幕味儿 浏览 733
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4