关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者243人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

印度商人:有中国就不怕美国加税 中印本应并肩作战

澎湃新闻 浏览 350

港元,突然暴涨!

米筐投资 浏览 500

民调显示:相较美国,加、德、法、英四国民众更信赖中国

环球网资讯 浏览 17397

50+女人怎么穿出时尚感?掌握这3招技巧,重新定义优雅与潮流

静儿时尚达人 浏览 383

蔚来全新ES8正式上市,起售价40.68万元

财经无忌 浏览 11400

冬天的“外套”别随便买!40+女人锁定这3款,优雅大气还保暖

静儿时尚达人 浏览 295

宁德时代AH股齐升 A股大涨超12%

网易财经 浏览 1190

上汽销量反超比亚迪,真实“含金量”如何

经济观察报 浏览 342

续航超1450km/座舱升级 全新GL8陆尊开启预售

网易汽车 浏览 537

《危险关系》是“大圆满”的结局?错了,这是一个彻底的悲剧

娱乐圈笔娱君 浏览 110

李月汝赛季报销美媒称心碎:ACL二级扭伤需6周康复 提前备战土超

颜小白的篮球梦 浏览 512

吕焯毅:我们踢得很团结有韧劲,大家都满意这场比赛

懂球帝 浏览 401

满电仅需6分钟,宁德时代发布新电池

大象新闻 浏览 108

突破西方封锁 万里眼超高速实时示波器全球首发

网易科技报道 浏览 400

张馨予华丽回归ELLE盛典,25斤重礼服惊艳全场

洲洲影视娱评 浏览 389

冠军魔咒再应验,高芙总决赛屡屡被报一箭之仇,黯然出局

网球之家 浏览 310

美国步步攫取委内瑞拉石油利益:主权在委 财权在美

澎湃新闻 浏览 225

基安德烈-库克晒照加盟广东合成图:地点不同但任务不变 杀戮继续

直播吧 浏览 719

全智贤自毁口碑!LV撤掉广告海蓝之谜外网都删,限韩令全面收紧

萌神木木 浏览 413

smart的野心

网易汽车 浏览 465

北航团队突破:让AI学会像人一样思考,不必每次都说出来

科技行者 浏览 231
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4