关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者508人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

立威第一枪?巴拿马拿中资港口开刀,李嘉诚228亿落空?

数字财经智库 浏览 17533

除了UGG,冬天还能穿什么?

时尚COSMO 浏览 311

金莎被小19岁的男友戴绿帽子?

Yuki女人故事 浏览 482

过了元旦 苹果会对 iPhone 18 系列陆续测试量产线

威锋网 浏览 321

王学圻出山,易烊千玺入局,郑保瑞这部统一台湾的大片要火了

娱乐圈笔娱君 浏览 330

被记者询问涉移民言论 德国总理回呛"问你们女儿去吧"

环球时报国际 浏览 352

苏永康被曝出轨!劣迹太多网友呼吁封杀?

萌神木木 浏览 311

精读季报丨谢治宇的基金,为什么只适合“买”,不适合“抄”?

一地基毛 浏览 1094

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 1406

美最新两种无人战斗机完成首飞 空战新时代正加速到来

澎湃新闻 浏览 381

伊姐清明热推:电视剧《冰湖重生》;电视剧《月鳞绮纪》......

伊周潮流 浏览 103

阿维塔求变:抱紧华为、告别个性走向大众

经济观察报 浏览 318

“东风Jeep”要来了?Jeep全球高层到访武汉

网易汽车 浏览 287

雅达利复刻“前竞争对手”Mattel Intellivision Sprint 游戏机

IT之家 浏览 384

韩安冉回应账号被封:辜负大家的期待,对自己来说是件好事

扒虾侃娱 浏览 283

普普京:首批量产型"榛树"导弹已交付俄军

每日经济新闻 浏览 451

少输当赢的利物浦,四大皆空哪还要等下回合?

仰卧撑FTUer 浏览 125

从“养儿防老”到攒私房钱,农村老人的想法变了

观察者网 浏览 6054

王楚钦:非常开心获得冠军,惊讶在美国还能遇见这么多球迷

懂球帝 浏览 576

帧帧美若油画,库布里克大神杰作告别放映!

幕味儿 浏览 221

关税预期与矿山停产“共振”,伦铜首次突破1.2万美元再创历史新高

华尔街见闻官方 浏览 5492
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4