关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报518人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

26款名爵MG7限时11.69万起 好玩才是必杀技

网易汽车 浏览 237

3门双座布局 smart精灵#2将于年底发布

车质网 浏览 241

与孙继海翻脸!董路:我的对手们甘愿被当枪使,自降身价智商全无

念洲 浏览 284

刘亦菲慷慨捐款150万助力香港,助力灾后重建与心理支持

茶韵浮生 浏览 344

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 351

这几条裙子太适合度假了,减龄又时髦!

LinkFashion 浏览 76

美海军第五舰队总部遇袭前后卫星图公开

扬子晚报 浏览 162

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 255

转会捡漏?多特蒙德有意签下弗里克麾下天才

绿茵情报局 浏览 228

纳帅:特尔施特根是否在豪门不是关键,重要的是他要上场比赛

懂球帝 浏览 316

高市早苗:希望尽早见到特朗普

中国青年报 浏览 293

上台后第一次 特朗普用7个字形容中国对华态度变了

现代小青青慕慕 浏览 378

巴顿社媒谈津门虎不敌浙江:尽力了大家!

直播吧 浏览 428

多名美高官将参与监督在委事务 特朗普:最终由我负责

每日经济新闻 浏览 243

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 1158

江文豪:塞蒂恩让我放开踢,希望可以跟球队一块拿到足协杯冠军

直播吧 浏览 472

记者:巴萨要求科莫答复佩尼亚转会事宜,塞尔塔也对他感兴趣

直播吧 浏览 420

定价或在 8 万元级,轩逸纯电继承者日产 N6 要来了!

爱范儿 浏览 532

比亚迪技术研发人员涨薪,研发人员总数超12万人

红星资本局 浏览 1274

9月中级车市场洗牌,新能源新兵为何也栽了跟头?

百姓评车 浏览 350

海昌智能IPO:“母子”共同“闯关”,重大关联交易或成拦路虎

览富财经网 浏览 938
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4