关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者34人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

3年200亿 高景太阳能高估值暗藏风险

北京商报 浏览 7955

最真实又时髦的路人街拍!看完想照着copy一周

黎贝卡的异想世界 浏览 4436

写字楼大量空置成欧美“定时炸弹”,美媒:像贯穿全球经济的黑暗裂缝

环球网资讯 浏览 8190

费迪南德:巴因德尔没有给我带来足够的信心,他必须习惯身体对抗

直播吧 浏览 52

"露奶衫"算什么?这6件斩女衬衫才是真时髦显瘦!早春这么穿很美

Yuki女人故事 浏览 304

米体:曼联将给奥纳纳双倍年薪&周五联系国米 德赫亚或去沙特联赛

直播吧 浏览 7150

小红书电商“市集”成为一级入口,已开始测试

网易科技报道 浏览 30

日媒叫嚣将协防台湾,不过是向主子点头哈腰罢了

趣看热点 浏览 17673

五角大楼泄露文件称台军难抵御大陆空袭 台军表尊重

环球网资讯 浏览 61492

远洋集团陷巨额亏损 员工:2大股东曾派调查组评估家底

红星新闻 浏览 41295

减重5.9kg 福特Mustang GTD裸碳版官图发布

车质网 浏览 68

刘銮雄携妻儿现身:甘比美成贵妇 儿子虎头虎脑

FancyMusic 浏览 7085

1-6,3-6!朱琳连丢两盘不敌世界第一,温网惨遭一轮游

ALL体育 浏览 7438

街道办设专门办公室处理"续面"事件 律师:店主涉违法

澎湃新闻 浏览 49

又摊上事!德云社被处罚,到底动了谁的奶酪?

盖饭人物 浏览 8189

全新哈弗H9申报图曝光,将提供两种动力版本

天天汽车 浏览 4044

官宣!辽宁连签三四队主帅,吴庆龙成金字招牌,刘子庆在干实事!

篮球资讯达人 浏览 6943

V型反转!大金融率先开启反攻,消费板块热点逐渐扩散

Wind万得 浏览 5287

天猫拟推小时购业务 阿里副总裁刘鹏挂帅

财联社 浏览 10735

外媒:苹果大幅下调首款头显产量目标,因设计复杂和生产难度大

澎湃新闻 浏览 6735

全世界最美的8条裙子 没有女人能拒绝

LinkFashion 浏览 6106
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4