关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者507人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

明抢!中国企业147亿半导体资产被荷兰政府冻结,CEO被停职;小米第三款车YU9多张实车谍照曝光;美团外卖骑手能屏蔽顾客了丨雷峰早报

雷峰网 浏览 405

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 5790

牛弹琴:“可怜”的泽连斯基 又被特朗普“戏弄”了

上游新闻 浏览 376

金九银十冲刺期:中国车企最新销量与目标完成率同步披露

汽车族杂志 浏览 398

上映27天被观众赶出院线!网播也救不了它,事实证明烂片已无市场

娱乐圈笔娱君 浏览 245

阿莫林自信可率曼联英超夺冠!对比弗爵时代不公平,理解名宿质疑

罗米的曼联博客 浏览 276

零百加速2.5s 法拉利Luce将于5月首发

车质网 浏览 179

他是刘德华的绯闻男友,也是唯一绝交的朋友

桑葚爱动画 浏览 460

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 271

智能跃迁 广汽丰田威兰达新老款车型对比

车质网 浏览 278

雄鹿竟输奇才!近9战8负状态堪忧 字母独木难支多队盼他申请交易

颜小白的篮球梦 浏览 300

看AI变身游戏达人:莫斯科研究院开发超快视觉智能测试平台KAGE

科技行者 浏览 237

AtomGit正式上线,中国开源AI雏形已现

钛媒体APP 浏览 297

法尔克:皇马和切尔西将争夺于帕,签字费是他与拜仁续约障碍

懂球帝 浏览 388

鲁媒:瓦科留队已经没有悬念,洛佩斯离队是大概率事件

懂球帝 浏览 271

49岁梁咏琪拼命吸金,打扮朴素逛超市

秋枫凋零 浏览 227

孔帕尼:我们非常珍惜拜仁现在的团队氛围,会努力维护它

懂球帝 浏览 165

广汽传祺1月交付新车 终端销量逆势双增长

网易汽车 浏览 210

弱化电动布局 英菲尼迪最新消息曝光

乐选爱车 浏览 501

贝莱林:温格视足球为艺术,阿尔特塔和他就如同一枚硬币的两面

直播吧 浏览 462

中国车在俄份额跌破50%,新一轮洗牌开启

汽车公社 浏览 334
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4