关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者384人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 1248

开新局·走市场|烟火“彭”湃!徐州有座“不夜城”!

中国商报 浏览 831

腾势Z9GT 3月5日开启预售 单电机版本续航1036km

网易汽车 浏览 189

中国车在俄份额跌破50%,新一轮洗牌开启

汽车公社 浏览 339

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 412

史上头次只有6人拍总决赛合照,ATP骚操作引球迷众怒:德约呢?

网球之家 浏览 358

中国对日本断供稀土日本舆论炸锅 日当局回应让人气愤

时时有聊 浏览 263

谷歌 CEO 皮查伊确认:下一代 AI 模型 Gemini 3 今年发布

IT之家 浏览 330

泽连斯基:前线局势愈发艰难

界面新闻 浏览 317

友人追忆杨振宁:他其实还有一个遗憾

大象新闻 浏览 393

谢霆锋跟着遭殃!英皇力捧张敬轩回内地被抵制

可乐谈情感 浏览 93

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 272

早春就该穿毛衣+半裙,这些日系穿搭太优雅,路人也能轻松变女神

Yuki时尚酱 浏览 719

3门双座布局 smart精灵#2将于年底发布

车质网 浏览 242

OpenAI与博通达成数十亿美元芯片开发协议

国际金融报 浏览 1404

OpenAI完成重组!微软持股缩减至27%,市值再超4万亿美元

澎湃新闻 浏览 368

英国AI科技界的“她力量”

新华社 浏览 393

落地11万,现在的速腾还能买吗?

正在说车 浏览 237

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 395

唱吧等39款APP被通报

第一财经资讯 浏览 351

美制裁马杜罗家族成员 加大对委政权施压

财联社 浏览 290
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4