关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者256人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王家卫霸凌唐嫣!?

八卦疯叔 浏览 346

Andrej Karpathy:纯视觉自动驾驶必要且充分

AI寒武纪 浏览 506

深度解读“碱基编辑技术”:首个定制基因编辑疗法案例获成功

DeepTech深科技 浏览 280

存储三巨头冲破万亿美元市值,长鑫科技上市到底值多少钱?

郭施亮 浏览 6942

新年第一顶帽子,就要不基础

时尚COSMO 浏览 285

守不住,阿森纳连续20次联赛对利物浦每场都失球

懂球帝 浏览 247

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 589

小伙去理发被店家弄到VIP房间后脸白了 联系父母要钱

1818黄金眼 浏览 74

一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军

新智元 浏览 369

加沙民众讲述领援助时遭袭经历:冒死也得去

上观新闻 浏览 567

从奇瑞到比亚迪,玛莎拉蒂怎么活成了“绿茶”?

优视汽车 浏览 31

特朗普:乌克兰不该"挑战比自己大十倍的国家"

环球时报国际 浏览 457

顶楼住户拆除楼板升高数米加盖 一楼出现从上到下裂缝

大风新闻 浏览 351

特朗普:可能接管伊朗的哈梅内伊接班人 在空袭中丧生

扬子晚报 浏览 161

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 343

汕头这座网红城市,为何存在“经济烦恼”?

中访网 浏览 3927

蔚来又一车型爆单!

电动知家 浏览 240

农妇收玉米时遇山体坍塌失联4天 周边马路出现大坑

红星新闻 浏览 341

CBA疯狂一夜:广东遭上海双杀,前总冠军23连败,最新积分榜如下

侃球熊弟 浏览 213

南京万象汇偶遇梁朝伟,个子不高但气场超强

乡野小珥 浏览 81

跟队:切尔西将不会有正式主帅带队客战曼城

懂球帝 浏览 289
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4