关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者158人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日本宣布:推迟发射新型无人货运飞船HTV-X

上观新闻 浏览 334

Meta裁员后续:田渊栋被过河拆桥,姚顺雨等集体「抢人」

机器之心Pro 浏览 298

业余球手夺一球致胜冠军!高芙贡献名面,周杰伦球都没碰到就出局

网球之家 浏览 166

张家辉夫妻米兰吃火锅!与粉丝合影细节暖心

陌识 浏览 164

贡多齐:尤文目前的状态并不理想,我们有足够的实力击败他们

懂球帝 浏览 292

多名男女在呼伦贝尔大草原上跳起"纸片舞" 当地回应

扬子晚报 浏览 290

女子取240万现金"给外甥当彩礼" 外甥:根本没有对象

环球网资讯 浏览 174

郭富城三胎还是女儿!狗仔拍到其扁嘴照,方媛发声强调不在乎性别

萌神木木 浏览 291

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 1285

离岸人民币大涨超300点!道指、标普500指数均再创收盘新高!

每日经济新闻 浏览 1370

委内瑞拉强烈反对“美国封锁空域”

国际在线 浏览 190

E句话| 在西藏办烟花秀的品牌已道歉?

仙女事件簿 浏览 319

河南女孩带村里46名老人游郑州 有人穿得比结婚还整齐

极目新闻 浏览 438

内塔尼亚胡被指传话无意攻击伊朗 与其公开表态相背离

红星新闻 浏览 147

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 319

那些被称赞 “老得慢” 的阿姨们,这样穿,比同龄人显年轻

静儿时尚达人 浏览 183

蔚来ES9压轴登场,“9系”五强争霸:谁是中国豪华新能源的终极答案?|汽车观察

封面新闻 浏览 16

新赛季首周精彩纷呈!波兰终夺联合杯,萨巴梅总同享22!

网球之家 浏览 142

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 304

千亿减肥药市场打响“地板价”争夺战

中国商报 浏览 1345

女佣自杀,最贵凶宅诞生!许家印好牌友要吐血

说财猫 浏览 346
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4