关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者352人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广州策马向前,跑好第一程!

无冕财经 浏览 924

丰田辟谣与比亚迪技术合作,网友的评论,能让丰田章男能背过气去

小李车评李建红 浏览 124

马杨马君妍官宣怀二胎,马立奥要当哥哥了

扒虾侃娱 浏览 232

杀人诛心哈利伯顿直播玩2K 网友“亚历山大”过来偶遇

直播吧 浏览 272

北美夺冠,成本超3.5亿,刚打败《浪浪山》的成龙又迎来了对手

靠谱电影君 浏览 351

马哈德迈连续两轮吹中超,他曾执法国足金色三分钟绝杀巴林

懂球帝 浏览 325

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 198

“苏超”MVP范厚泰:感恩亚泰,感恩泰州,感恩“苏超”平台

懂球帝 浏览 196

这些才是真正适合普通人的穿搭!舒适减龄,整体形象得到美化

静儿时尚达人 浏览 230

美财长挑拨中阿关系称"米莱要将中国赶走" 阿根廷回应

澎湃新闻 浏览 238

万科董事长辛杰辞职!年薪0元、原定明年退休,曾多次代表深铁力挺万科

时代周报 浏览 528

当众辱骂阿隆索!1.5亿欧熊皇惹怒老佛爷+更衣室 皇马准备处罚他

风过乡 浏览 219

S妈现身大S雕像揭幕仪式,S家人穿黑衣现身,纪念碑刻着“S”字样

素素娱乐 浏览 80

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 175

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 241

海南华铁“失算”疑云:36.9亿元“三无”合约终止,阿里云前高管参与,“牛散”结伴进退

证券时报e公司 浏览 525

阿里正把自己装进赛博分身

虎嗅APP 浏览 1817

杨天真冷漠背后:杨子姗6年贡献不足,解约时连20字祝福都吝啬!娱乐圈价值论太扎心

阿废冷眼观察所 浏览 286

普京提议在莫斯科和泽连斯基"一对一" 白宫想三方会面

红星新闻 浏览 375

上海千万豪宅业主称"水脏到不敢用":菌落总数超标24倍

新民晚报 浏览 346

2025年首例被北交所暂缓审议的企业出炉 永大股份上市缘何待考?

叩叩财讯 浏览 4356
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4