关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者257人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI数据中心太火,美商务部长被盯上了,民主党议员发函敦促调查利益冲突

华尔街见闻官方 浏览 2045

三人伪装"外卖员""钓鱼佬"窃取军事秘密 详情公布

扬子晚报 浏览 419

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 373

三星 Exynos 芯片被曝放大招:5G 基带将首次集成 AI 核心

IT之家 浏览 392

东南大学突破:AI学会情境化拒绝能力

科技行者 浏览 384

波兰防长:东部发现的不明物体为俄军用无人机

环球网资讯 浏览 488

上海楼市温和回暖,招商、保利5天狂揽近30亿销售额

国际金融报 浏览 18182

76人新赛季不败金身被破,全胜球队仅剩马刺、雷霆和公牛

懂球帝 浏览 314

33岁的张一山惊艳亮相,杨紫这次真得避嫌了?

探长影视解说 浏览 349

以军禁止约旦人道主义援助物资进入加沙

北青网-北京青年报 浏览 391

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 387

60岁的妈妈夏天如何打扮?穿衣要不老气、不装嫩,得体又优雅

静儿时尚达人 浏览 535

极端寒潮冲击美国电力系统,芝加哥电价为何跌入负值?

国际金融报 浏览 814

哀悼,西班牙足球史上第一位女性主席阿米莉亚去世,享年82岁

懂球帝 浏览 242

佘智江获利达1.5亿元:曾逼美貌女性卖淫 或供"玩乐"

新京报 浏览 290

农妇遭错判寻衅滋事罪被羁押507天 获30万元国家赔偿

扬子晚报 浏览 196

年薪180万!众泰汽车副总裁被罢免

经理人杂志 浏览 644

时隔十年上证指数重返3900点 四季度A股“开门红”

商业观察杂志社 浏览 358

U23亚洲杯8强出炉 1/4决赛对阵:国足第2出线战上届亚军 避开日韩

我爱英超 浏览 254

350亿vs25000亿!国产模型正打破美国AI编程垄断

无相商业趋势 浏览 998

在桃浦,解锁未来发展无限可能

上观新闻 浏览 273
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4