关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者130人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗外长:伊朗给美国人"准备了许多惊喜"

界面新闻 浏览 60

大一男生疑被骗至柬埔寨 母亲发声:已报警

环球网资讯 浏览 484

新款本田雅阁来了 全新升级 竞争力再次提升

大李聊车 浏览 679

多家银行关停旗下App,银行App关闭潮意味着什么?

江瀚视野 浏览 1266

马斯克宣布脑机接口将量产,特斯拉自动驾驶挑战引发安全质疑

红星新闻 浏览 161

捷途纵横G700限时售30.49万起 轮端扭矩过万

网易汽车 浏览 282

小米“巨省电”,为何又是一波大争议?

正经社 浏览 1050

上半年营收18亿元同比增长12.3% 美图公司透露与阿里巴巴合作进展

经济观察报 浏览 389

江文豪:塞蒂恩让我放开踢,希望可以跟球队一块拿到足协杯冠军

直播吧 浏览 361

E句话| 在西藏办烟花秀的品牌已道歉?

仙女事件簿 浏览 299

李连杰公布病情 “照镜子时发现肿块”

策略剖析 浏览 363

父子除夕夜放烟花引火灾致1死1伤 父亲被判7年赔270万

红星新闻 浏览 456

这场活动让李亚鹏被骂13年!成了离婚导火索

萌神木木 浏览 123

月销破7万台!汽车圈外行朱江明,成新势力大赢家

象视汽车 浏览 233

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

科技行者 浏览 128

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 190

三年半烧掉35亿!一帮金融人,带“火箭”冲科创板

财通社 浏览 1312

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 279

蔚来公司12月交付新车48,135台 同比增长54.6%

网易汽车 浏览 170

18岁松岛握拳怒吼!2连冠后豪言洛奥成主力 张本一哥席位摇摇欲坠

颜小白的篮球梦 浏览 121

打通置换堵点!上海放大招:政府启动二手房收购

国际金融报 浏览 985
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4