关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者82人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 193

郑爽广电封禁通知曝光!日子久了都忘了她多恶劣

萌神木木 浏览 92

韩国特使离开北京 中方提出一个要求李在明口风变了

梁讯 浏览 351

今年春天最流行的4组配色,过年穿时髦又高级!

LinkFashion 浏览 16

退休后,他们重新开始上班:“工资不高,图个开心”

时代周报 浏览 755

天安门广场核心区布置基本就绪 新增临时观礼台

央视新闻客户端 浏览 283

17岁小伙疑陷东南亚骗局 家人收其戴手铐跪地照片

大风新闻 浏览 138

达成停火22天内 仅有商定数量24%的卡车进入加沙

上观新闻 浏览 200

立案!光环下的清越科技,藏着多少“秘密”?

财经下午茶 浏览 1104

纵横外卖江湖十三载!美团做对了什么?

互联网那些事 浏览 11

人到中年穿衣不跟风!试试经典款+莫兰迪色,轻松穿出高级感

静儿时尚达人 浏览 284

记者:阿坎吉已经抵达米兰城,将接受国米的体检

直播吧 浏览 266

近7场1胜6负,河床近期战绩非常糟糕

懂球帝 浏览 248

同游仍少年!精灵世界空降杭州

时尚COSMO 浏览 214

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 383

普京:与乌克兰无条件停火不可能

每日经济新闻 浏览 177

父子在亲戚公司上班遇爆炸全身烧伤花费百万 亲戚回应

潇湘晨报 浏览 220

500万闪电到账!浦发、中信、广发等五大商业银行联手破解中小微企业融资困局

杠杆游戏 浏览 2267

米尔纳:我看到若塔做过那个庆祝动作,我可能模仿得不太好

懂球帝 浏览 330

OpenMind 开源全球首个“AI 原生”机器人系统 OM1 Beta

IT之家 浏览 284

一加中国区总裁李杰:有的手机宣传边框存在“测算猫腻”

IT之家 浏览 236
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4