关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者252人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

唐嫣罗晋恩爱人设崩塌了!夫妻常年两地分居,全靠女方一家带娃

萌神木木 浏览 248

贡多齐:尤文目前的状态并不理想,我们有足够的实力击败他们

懂球帝 浏览 272

热议日本3-2巴西:几十年认准一条路;人家从容我们连滚带爬

懂球帝 浏览 275

刘强东“最值钱”的金融牌照,迎来75后掌舵人

经理人杂志 浏览 581

9系合围高端 极氪9X闯入40-50万价格带?

网易汽车 浏览 430

点啥啥火,天风美女首席“吓得”散群!那些强得可怕的分析师们

深蓝财经 浏览 2769

XREAL启用上海浦东全球总部,明年推出首款Android XR系统AR眼镜

IT之家 浏览 263

天空体育:若利物浦向塞门约发出邀约,球员就会选择加盟

懂球帝 浏览 168

小S的第3个女儿发自拍照,14岁就很漂亮,外形完成惊艳蜕变

素素娱乐 浏览 81

苹果M5芯片,击败高通新旗舰

半导体行业观察 浏览 1414

许家印侄子许火健豪宅被法拍,起拍价4400万元,配有5个洗手间

红星资本局 浏览 762

郑钦文晒照新教练技改,外媒称其剑指法网阳光双赛成绩是合作关键

网球之家 浏览 66

雷克萨斯,凭什么2025还能逆势增长?

汽车人传媒 浏览 106

极氪2025年12月交付30267台 单月首破3万大关

网易汽车 浏览 152

赖清德宣布追加400亿美元用于对美军购 提及2个时间点

经济观察报 浏览 181

大动作!科技巨头,摊牌了!

米筐投资 浏览 5769

皮尔斯:詹姆斯有着大前锋身材&后卫打法 他身材和大本一样

直播吧 浏览 325

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 117

传美国入股?台积电不予置评

看看新闻Knews 浏览 383

媒体:中国不惧美方施压 "偏逆着来"购买更多俄石油

澎湃新闻 浏览 275

ESG评级冲上AA,陆金所还有难题要解

节点财经 浏览 984
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4