关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者53人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子和33名男子开房:为还300万债务出卖肉体

汉史趣闻 浏览 47710

独家对话旺仔小乔“榜一大哥”:一场直播曾打赏7万元,让自己别为她难过而改名“别难过”

红星新闻 浏览 66

韩国峰会临近特朗普频频放风 突然公布一涉华重磅消息

现代小青青慕慕 浏览 78

普通人穿衣别太发愁,学会这些基础穿搭,舒适大方又省时间

静儿时尚达人 浏览 72

总投资90多亿医院突然申请注销!发生了啥?

中国新闻社 浏览 7630

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 8

韩雪在香港聚餐肤白貌美戴两块手表,饮食方式被骂

叶公子 浏览 8581

PSL4个月净归还额度超5000亿

21金融圈 浏览 4506

17岁小伙疑陷东南亚骗局 家人收其戴手铐跪地照片

大风新闻 浏览 13

66岁老汉成拆迁户暴富2年找了5任妻子:不合适就散

奇史殿堂 浏览 52924

巴列卡诺在欧协联附加赛的一个进球被VAR判有效,后来又改判无效

懂球帝 浏览 207

本轮巴以冲突已致加沙地带61330人死亡

国际在线 浏览 211

有报道称印度在中印边境新部署1万名士兵 外交部回应

环球网 浏览 35129

因为不想8小时坐班,这个小伙成了环法冠军

界外编辑部 浏览 243

维拉本赛季禁区外进球冠绝英超,甚至比禁区内进球还多

懂球帝 浏览 75

朱珠一家旅游!女儿为妈妈补妆 对奶嘴有瘾惹争议

叶公子 浏览 6079

广西百色多个村屯被洪水浸泡逾20日 多个村屯成孤岛

南方都市报 浏览 95

现任女市委书记至少20人 其中2人系中央候补委员

上观新闻 浏览 34770

泰康资产段国圣:AI切入投研赛道,资管行业价值链有望重塑

券商中国 浏览 1036

领克Z10迎OTA升级 新增25项功能和10项优化

网易汽车 浏览 428

76岁许绍雄去世:叔公参与创立黄埔军校 姑婆是许广平

红星新闻 浏览 58
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4