关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者400人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

专为皮卡打造/提升产品力 上汽大通星栈平台为破局而来

网易汽车 浏览 407

媒体:高市早苗想见中国领导人 也未必是特别难的事

新民周刊 浏览 233

打通置换堵点!上海放大招:政府启动二手房收购

国际金融报 浏览 984

票房从13.65亿跌到1730万,我五味杂陈:这块金字招牌算是砸了

靠谱电影君 浏览 256

海港亚冠8战不胜!3轮仅1分,对日本球队9战不胜,延续5魔咒

奥拜尔 浏览 285

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 233

极简风格配多功能扩展孔位 零跑B10内饰谍照首曝

网易汽车 浏览 529

9月MPV销量榜大洗牌,魏牌高山首夺魁,新能源车型主导市场格局

玩车专家1 浏览 276

宝利德破产听证后官司缠身 昔日豪车经销商驶向何方

财闻 浏览 6224

普京赠送美国一居民新摩托 生产商:俄方要得很急

鲁中晨报 浏览 401

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 190

哈梅内伊遇袭身亡 被指已指定暂代最高领袖责任人选

新民周刊 浏览 59

中印外长再聚首 印外长感谢中国赞对话"富有成效"

上观新闻 浏览 446

卫星图像首次发现:伊朗两处受损核设施有"重大活动"

澎湃新闻 浏览 112

3名自称宗庆后非婚生子女:母亲为娃哈哈前高管杜建英

上观新闻 浏览 519

方程豹6月狂卖1.8万辆

大象新闻 浏览 462

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 238

美航母连坠两机原因引猜测

环球网资讯 浏览 250

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 153

布朗三节41+6!绿军狂胜老鹰列东部第二 豪瑟30+10三分平纪录

醉卧浮生 浏览 99

A股:再刷新历史纪录!

小白读财经 浏览 10738
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4