关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者241人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑钦文晒照新教练技改,外媒称其剑指法网阳光双赛成绩是合作关键

网球之家 浏览 201

美国宇航局成功验证太空识别GPS干扰源能力

IT之家 浏览 44

俄乌冲突三年,炮火炸出全球财富新地图

浏览 606

当人类把经验与想象力交给机器人,具身智能如何承载新内容?

刺猬公社 浏览 255

董璇给张维伊老家亲戚买金子,男方瞬间变脸,双方经济实力差太多

萌神木木 浏览 475

"特朗普级"战列舰造价公布:高达220亿美元

极目新闻 浏览 268

今年最狠悬疑剧,好人为何集体沉沦?

仙女事件簿 浏览 361

苏超第11轮门票预约30日8时开始,中签结果9月2日20时公布

懂球帝 浏览 491

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 255

Kid退赛,脱人倒油:脱口秀撞梗抄袭难定义?

仙女事件簿 浏览 474

"叶某斌在柬埔寨失联"详情披露:全程自主行动

贵州日报 浏览 255

柬埔寨内政部:柬泰冲突已致31名柬平民死亡

国际在线 浏览 227

定位大型SUV 腾势N8L无伪装实车图曝光

车质网 浏览 593

随着阿森纳1-0领先,曼城0-1落后,英超最新积分榜:利物浦4连败

侃球熊弟 浏览 376

全智贤新剧公然辱华:女神形象中国彻底崩塌,背后真相被曝光

影像温度 浏览 409

“一球制胜”周董首轮游,两ATP巡回赛冷风劲吹!

网球之家 浏览 252

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者 浏览 226

吉利熊猫卡丁猪猪侠限定版快乐专享价4.69万元

网易汽车 浏览 465

曝李金铭怀孕待产!直播账号已停更近半年,曾卷入知三当三风波

萌神木木 浏览 250

伊姐周日热推:访谈《陈鲁豫·漫谈》;电视剧《目之所及》......

伊周潮流 浏览 785

台北攻击事件嫌犯携满箱汽油弹欲纵火 被男子舍命拦下

红星新闻 浏览 251
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4