关闭广告

谷歌DeepMind让AI大脑学会了超强＂语言视觉连接＂

科技行者352人阅读

这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月，研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛"，不仅能理解英语图片，还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的：当你看到一张照片时，你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片，你会立刻想到"猫"这个词，甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言，你还能用不同语言来描述同一张图片的内容。

现在，研究团队成功让AI也具备了这种跨语言的"看图说话"能力，而且表现得比以往任何系统都要出色

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

这个冬天《鬼怪》“解冻”得有些早

时尚COSMO 浏览 158

丹麦国防部：若美国武力夺岛丹麦士兵可先开枪再请示

环球网资讯浏览 96

向五角大楼匿名捐赠1.3亿美元＂军饷＂的富豪身份披露

鲁中晨报浏览 209

精彩推荐

广州策马向前，跑好第一程！

无冕财经浏览 924

丰田辟谣与比亚迪技术合作，网友的评论，能让丰田章男能背过气去

小李车评李建红浏览 124

马杨马君妍官宣怀二胎，马立奥要当哥哥了

扒虾侃娱浏览 232

杀人诛心哈利伯顿直播玩2K 网友“亚历山大”过来偶遇

直播吧浏览 272

北美夺冠，成本超3.5亿，刚打败《浪浪山》的成龙又迎来了对手

靠谱电影君浏览 351

马哈德迈连续两轮吹中超，他曾执法国足金色三分钟绝杀巴林

懂球帝浏览 325

倪妮告秦雯和王家卫！？

八卦疯叔浏览 198

“苏超”MVP范厚泰：感恩亚泰，感恩泰州，感恩“苏超”平台

懂球帝浏览 196

这些才是真正适合普通人的穿搭！舒适减龄，整体形象得到美化

静儿时尚达人浏览 230

美财长挑拨中阿关系称＂米莱要将中国赶走＂阿根廷回应

澎湃新闻浏览 238

万科董事长辛杰辞职！年薪0元、原定明年退休，曾多次代表深铁力挺万科

时代周报浏览 528

当众辱骂阿隆索！1.5亿欧熊皇惹怒老佛爷+更衣室皇马准备处罚他

风过乡浏览 219

S妈现身大S雕像揭幕仪式，S家人穿黑衣现身，纪念碑刻着“S”字样

素素娱乐浏览 80

法尔克：曼城有意科隆前锋赛义德-马拉，巴黎和国米也在关注

懂球帝浏览 175

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道浏览 241

海南华铁“失算”疑云：36.9亿元“三无”合约终止，阿里云前高管参与，“牛散”结伴进退

证券时报e公司浏览 525

阿里正把自己装进赛博分身

虎嗅APP 浏览 1817

杨天真冷漠背后：杨子姗6年贡献不足，解约时连20字祝福都吝啬！娱乐圈价值论太扎心

阿废冷眼观察所浏览 286

普京提议在莫斯科和泽连斯基＂一对一＂白宫想三方会面

红星新闻浏览 375

上海千万豪宅业主称＂水脏到不敢用＂:菌落总数超标24倍

新民晚报浏览 346

2025年首例被北交所暂缓审议的企业出炉永大股份上市缘何待考？

叩叩财讯浏览 4356

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
闽ICP备16027347号-4