关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者123人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 207

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 282

跌落神坛!“逼疯”黄奕,“整了”周迅的他,因王家卫再次被牵连

温柔娱公子 浏览 290

美推进“金穹”系统的天基拦截器研制 但钱和技术都存在问题

澎湃新闻 浏览 289

上海这一夜,妖艳四射的热巴和杨幂,败给了全“裹”出镜的宋佳

娱乐圈笔娱君 浏览 437

成库里品牌签约首位中国球员!朱正:当然求之不得 库里是我的偶像

直播吧 浏览 407

「冰雪+温泉」模式:山地文旅地产如何重构冬季休闲生活?

豹变 浏览 4776

高盛大幅上调阿里目标价,看好中国数据中心行业估值提升

华尔街见闻官方 浏览 3721

王传君拿下东京电影节影帝!撕奖过程太精彩,连坑两位中国女星

萌神木木 浏览 269

河南最大城商行迎博士行长,曾任濮阳副市长、为湖南大学校友

湘财Plus 浏览 655

晚点独家丨理想调整基座模型业务:詹锟接手,VLA 研发整合

晚点LatePost 浏览 125

圣诞节,我想看这几部电影!

Yuki女人故事 浏览 161

台名嘴:大陆对高市早苗提出抗议的层级越来越高

环球时报新闻 浏览 192

伊朗就新的最高领袖人选作出最终决定

新华社 浏览 41

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 1092

意媒:尤文完成备战皇马最后一练,米雷蒂和热格罗瓦回归合练

懂球帝 浏览 254

33岁的张一山惊艳亮相,杨紫这次真得避嫌了?

探长影视解说 浏览 247

12套韩系氛围感穿搭!显瘦不挑人,谁穿谁好看!

Yuki女人故事 浏览 424

今年春天流行穿套装,太高级了!

LinkFashion 浏览 572

卡拉格:如果枪手本赛季夺冠,拉亚一定是最关键的因素之一

懂球帝 浏览 38

黄金有关税收新政落地首周,市场各方反应如何?

中国商报 浏览 1487
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4