关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者312人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

运营商 AT&T“人人免费得 iPhone 16 Pro”广告被裁定为虚假宣传

IT之家 浏览 242

4-1!中国男足大反弹,一举终结2连败,15岁小将大四喜,出线有戏

侃球熊弟 浏览 316

网红版闫学晶!600万粉博主阿爆翻车

萌神木木 浏览 133

90后“富二代”接棒零食帝国!1.5万家好想来年入323亿冲刺IPO

野马财经 浏览 9744

杜若溪一家海外度假,老公和女儿一起出镜

小小一米月儿 浏览 197

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 198

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 287

特朗普警告:如果以吞并约旦河西岸 将失去美所有支持

鲁中晨报 浏览 230

理想汽车段吉超:造车这件事,可以借鉴零售业的胖东来模式

经济观察报 浏览 229

内娱00后小花杀疯了!凭什么碾压杨幂、热巴,成为新一代女顶流?

Yuki女人故事 浏览 612

女演员自曝曾遭受校园暴力!留下心理阴影

鲁中晨报 浏览 161

伊朗总统最新表态:将重建核设施

政知新媒体 浏览 224

《红舞鞋》剧组被曝压榨群演!工作11小时仅70元,剧方还威胁学生

萌神木木 浏览 281

万科开启了第二笔中票展期

国际金融报 浏览 1799

成都事故后,雷军最新发声

都市快报橙柿互动 浏览 299

特朗普关税大棒砸向巴西,卢拉当场掀桌

浏览 523

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 159

马卡:皇马目前没考虑施洛特贝克,弗里克很欣赏他但转会不易

懂球帝 浏览 141

科长,我啥时候才能换电脑啊?

识局 浏览 968

一路走好!歌手千百惠因病离世,享年62岁,黄安发讣告证实

扒虾侃娱 浏览 444

日本政客鼓吹发展核武 还锅甩给特朗普

澎湃新闻 浏览 432
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4