关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者151人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地|36氪首发

36氪 浏览 195

继与霉霉恋情谣言后,里弗斯被传约会网红

艺兔体坛 浏览 173

一天之内 以军空袭黎巴嫩致254死1165伤

新民晚报 浏览 18

演员金莎和孙丞潇官宣结婚 两人相差17岁

极目新闻 浏览 14

郑丽文"不谈统一"让人失望了 蔡正元的话一针见血

现代小青青慕慕 浏览 271

偷鸡不成蚀把米!白百何疑开撕王传君,自己却先被骂了个底朝天

娱乐圈笔娱君 浏览 260

请不要再给老戏骨刷绿漆

时尚COSMO 浏览 634

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 297

伊朗高级官员:已做好与美以长期作战的准备

央视新闻客户端 浏览 61

59岁无儿无女,王晶为何说张卫健一点都不惨

林雁飞 浏览 184

女子被逼嫁给大15岁男子喝农药轻生 钱被母亲拿走买房

大风新闻 浏览 168

女明星阚琳娜出面指控“郑总”:12岁遭到他侵犯

素素娱乐 浏览 639

潘江:大家的思想包袱还是太重,希望奈特能保持这样的状态

懂球帝 浏览 155

媒体:美方28点计划引全球哗然 泽连斯基将背负骂名

经济观察报 浏览 215

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 186

皇马TV显示,贝林厄姆将在国家德比中担任首发右边锋

懂球帝 浏览 269

致态 TiPlus 7100s 固态硬盘发布:长江存储新一代颗粒,659 元起

IT之家 浏览 221

第二家盈利的新势力诞生!零跑上调全年销量目标至65万辆

国际金融报 浏览 394

风电龙头明阳智能拟跨界太空光伏

北京商报 浏览 1917

双向奔赴!澳优乳业再度携手江南大学 为营养健康行业发展注入创新动能

中国商报 浏览 1177

追觅官宣造车,首款车型剑指布加迪

汽车公社 浏览 375
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4