关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者204人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美官员称台湾地区选举结束后美将派团访台 外交部回应

财联社 浏览 28281

机器人不约而同毛茸茸,年轻人抢着体验AI养老产品…首届WTCC太全面了

上观新闻 浏览 60

上海AI判定停车费被指掐秒算钱:让人下车停12秒收4元

潇湘晨报 浏览 240

成都锦里古街树木倾倒砸伤游客 目击者:树木是空心的

上游新闻 浏览 74

倪妮和杨幂的裤子 看着就凉快!

瑞丽网 浏览 7102

雷军、余承东等车圈顶流热议破卷 玩流量的高手在乎的不只流量

道哥说车 浏览 2671

美推进“金穹”系统的天基拦截器研制 但钱和技术都存在问题

澎湃新闻 浏览 102

315回头看丨羽感防晒翻车后,珀莱雅正推同系列新品,“生产环节不稳定”问题解决了?

红星资本局 浏览 12236

被成都街拍惊艳!满大街都是“短上衣+低腰裤”,露小蛮腰好性感

潮人志Fashion 浏览 2677

4.0T V8发动机 阿斯顿·马丁DB12 S官图发布

车质网 浏览 93

伊姐周日热推:电视剧《依依向北风》;电视剧《水龙吟》......

伊周潮流 浏览 80

痛别!姚守拙同志在长沙逝世,湖南大学发布讣告

环球网资讯 浏览 208

好消息,来了!

博闻财经 浏览 1176

111年之耻!巴西首次2比0领先却失利,安切洛蒂亲手揪出罪人

奥拜尔 浏览 86

智己L6和LS6登陆英国 可国内销量依然“叫好不叫座”

正在说车 浏览 253

安徽人买车,为什么爱上苏A牌照?

无相商业趋势 浏览 365

欣瑜淑薇进四强,鲁德再胜鲁内,斯瓦会师玛雅,郑钦文与教练分手

网球之家 浏览 8380

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 109

米尔纳:我看到若塔做过那个庆祝动作,我可能模仿得不太好

懂球帝 浏览 209

曾凡博等多人生病缺席!北京末节崩盘难阻深圳5连胜 范子铭24+9

醉卧浮生的体育世界 浏览 11070

加强关键矿产资源保障 促新能源车产业发展

中国证券报 浏览 11970
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4