关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者240人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泰国王太后诗丽吉逝世享年93岁,后宫恐加混乱

译言 浏览 197

IPO失败后,卖身上市公司又失败!一主要股东因开设赌场罪被判刑

财通社 浏览 901

空间实用/补能高效 吉利蓝气球限时钜惠价3.99万元起

网易汽车 浏览 181

美陆军部长抵达阿联酋首都 与俄“秘密会谈”

环球网资讯 浏览 148

今夏一定要拥有的6件衣服,怎么搭都时髦

LinkFashion 浏览 444

我用1秒成为陈妍希梦女,你也来试试吧

时尚COSMO 浏览 127

60岁阿姨靠穿搭火了!“简约款”穿出高级感,自然老去也很美

静儿时尚达人 浏览 222

媒体:特朗普关税战半年 市场没能打得开还弄丢了

新民晚报 浏览 206

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 204

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 241

硅谷投资人盛赞特斯拉人形机器人:将令人忘掉特斯拉造过车

澎湃新闻 浏览 86

于文文贵州演唱会晕倒,曝被救护车拉走

扒虾侃娱 浏览 71

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 171

“粉色+咖色”、“蓝色+白色”,春天这4组配色减龄又好看!

LinkFashion 浏览 646

"坦克兵王"将第6次参加阅兵

环球网资讯 浏览 334

国安2-4海牛历史首次主场输给对手,此前12战10胜2平仅失3球

懂球帝 浏览 218

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 137

美媒:美国下水一艘新军舰中国已造好三艘 差距惊人

澎湃新闻 浏览 115

阿尔巴:对我帮助最关键的是埃梅里;我心中梅西就是历史最佳

懂球帝 浏览 212

物理AI仿真新突破:摩尔线程与五一视界共建全栈国产化生态

爱集微 浏览 11

1万亿订单再加3500-5000亿美元!OpenAI“停不下来”,“当你欠每家数千亿美元,钱的问题自己会解决”?

华尔街见闻官方 浏览 1028
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4