关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者287人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

采用六座布局 阿维塔旗舰SUV谍照首曝

车质网 浏览 20

上海AI实验室ImgCoder:AI实现科学手绘图精准生成

科技行者 浏览 143

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 179

内存成本持续大涨,买手机电脑会越来越贵该怪谁?

江瀚视野 浏览 770

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 1318

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元 浏览 290

《长安二十四计》惊天逆转:虎贲竟是好人?

宇林网络 浏览 202

小区保安与居委会副主任及其妹妹冲突后 因脑出血住院

红星新闻 浏览 453

富勒姆球队大巴在英联杯赛前和一辆货车剐蹭,车体出现大划痕

懂球帝 浏览 191

AI赋能体育教育新图景:构建中小学智慧体育新生态

南方都市报 浏览 253

米体:罗马想冬窗租借齐尔克泽,若晋级欧冠会自动触发买断

懂球帝 浏览 231

网传毛晓彤陈晓已领证结婚,毛晓彤回应了

阿伧说事 浏览 399

特朗普,重仓了!

中国基金报 浏览 6466

客户集中度过高?英伟达隐忧浮现:前两大神秘客户贡献近四成营收

财联社 浏览 1217

45岁董洁北京定居,自己洗衣做饭很勤劳

无处不风景love 浏览 253

曾经拯救过无数个学生狗的360doc,倒下了。。。

差评XPIN 浏览 112

章泽天这次翻车,真的不冤

独立鱼 浏览 131

登场2分钟轰世界波!25岁国安边缘人险落泪 亚冠曾35秒闪击创纪录

我爱英超 浏览 422

2026款比亚迪海豹05 DM-i上市 售价7.98万元

车质网 浏览 316

秋天穿一件开着花的衣服,很美!

LinkFashion 浏览 418

苹果M4款iPad Air亮相,3月11日开启发售!

IT之家 浏览 80
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4