关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报520人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

余承东任华为终端公司董事长

雷达财经 浏览 251

美俄闭门会谈四个小时,泽连斯基被关门外

浏览 713

博时基金“换帅”

国际金融报 浏览 1102

好心载同事却出车祸遭索赔 法院:司机承担60%赔偿责任

极目新闻 浏览 349

官方:亚美尼亚和格鲁吉亚将联合举办2029年U20世界杯

懂球帝 浏览 119

女子名下房产被亲姑姑霸占近10年 最新进展来了

扬子晚报 浏览 533

续航增加200公里,26.95万的Model 3,有2万的降价空间?

路咖汽车 浏览 540

英伟达RTX Spark芯片细节:10x Cortex-X925+10x Cortex-A725核

IT之家 浏览 37

今年,北京要把奥林匹克塔打造成机器人餐厅!

北京商报 浏览 242

章若楠妹妹大婚

观察鉴娱 浏览 367

原来她就是黄景瑜背后的老板,曾是央视主持

因果 浏览 241

尤斯特:我目前核心目标是保持巴萨稳定,让球队不受外部干扰

懂球帝 浏览 172

挥别日上 免税市场洗牌

北京商报 浏览 3970

“十五五”规划建议:共有15个部分、61条,分为三大板块

国是直通车 浏览 1248

50+女人听我一句劝,别穿得太花哨和超短裙,才能优雅到老

静儿时尚达人 浏览 353

中方回应"有些国家因种种原因不愿出席九三纪念活动"

上观新闻 浏览 536

拍完被雪藏3年,小沈阳新片观众不买账,成本超1亿,预售仅6万

靠谱电影君 浏览 364

华为登顶,吃了谁的蛋糕?

智东西 浏览 257

资产上亿女老板突然失联 知情人:疑似被骗去泰国

上观新闻 浏览 487

姚期智:“AI+量子”将极大拓展人类计算能力边界

文汇报 浏览 423

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 270
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4