关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者424人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

43岁贾玲退出春晚、解散公司

月光作笺a 浏览 171

东北大学团队突破人类移动预测难题:让AI像人类一样理解出行规律

科技行者 浏览 280

理想汽车调整销服体系!总部直管,李想:9月i8挑战月销过万

车东西 浏览 400

“电池车”全面压过“发动机”一头?油车时代的辉煌,被彻底终结

少数派报告Report 浏览 229

持续烧钱的大模型,阻挡不了AI行业的热情

蓝鲸新闻 浏览 160

普京否认"俄计划攻击北约" 喊话西方国家:睡个好觉

环球网资讯 浏览 311

深夜!人民币,大涨!美联储,降息大消息!

券商中国 浏览 1361

张雨绮风波持续发酵,曝多个商务被取消

扒虾侃娱 浏览 120

对话千岛沈振宇:不要问我下一个Labubu是谁,我只知道它很快会来

晚点LatePost 浏览 413

今年最流行的4双凉鞋,配阔腿裤太好看了!

LinkFashion 浏览 443

拒绝平庸 福特烈马1966预售38.66万起

网易汽车 浏览 407

被演唱会上的叶倩文惊艳

喵喵娱乐团 浏览 315

刘嘉玲问刘晓庆:现在接戏的角色是否有限?

红星新闻 浏览 312

全新大众速腾L实车曝光!轴距没变,外观却“电味”十足

车评社Auto 浏览 511

美国USAID大量资金被冻结 反华组织都慌了

环球网资讯 浏览 619

安东尼奥3年2次突破!成05国奥主帅热门,媒体人:结果大于过程

奥拜尔 浏览 163

新年将至 普京问候前线俄军:感谢英勇的所有人

看看新闻Knews 浏览 143

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 275

落地为王:谁在用AI引领百亿价值跃迁?

虎嗅APP 浏览 4745

借鉴丰田GR与日产Nismo,本田也要搞专属运动车系HRC

CLauto酷乐汽车 浏览 152

辽粤会师全运会半决赛!杨鸣:广东占天时地利人和

体坛周报 浏览 254
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4