关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报521人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女孩被篮球砸头后确诊癔症自残失禁 母亲:我也不理解

上游新闻 浏览 359

萨巴伦卡取得年终总决赛两连胜

体坛周报 浏览 367

史上最牛妖股!149个涨停板,暴涨55000%......

中国基金报 浏览 1865

何小鹏的“回旋镖”与超级增程的“阳谋”

1号车盟 浏览 291

越遮越高级,搞穿搭原来真不看脸?

时尚COSMO 浏览 366

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 247

消息称华为 WATCH Ultimate 2 手表明日露出,预估 6000~7000 元

IT之家 浏览 400

2026品牌抢滩战:从野蛮生长,到“唯人格化”

霞光社 浏览 6303

解放军代表质问日防卫大臣:日本何时道歉

环球网资讯 浏览 32

拼劲十足!比尔半场8中4拿到9分6板3助

直播吧 浏览 599

BLACKPINK的新歌,这么“癫”!

时尚COSMO 浏览 597

博尔达拉斯:巧妇难为无米之炊,我不该承受这赛季所遭受的一切

懂球帝 浏览 248

美将暂停实施对华海事等301调查措施一年

财联社 浏览 319

奕境首款大六座SUV寒测图发布 满配华为智能科技

三个司机 浏览 221

海博思创400多亿市值背后,留美博士张剑辉的逆袭之路

尺度商业 浏览 1203

中超第27轮跑动距离榜:马德鲁加12689米居首,赛季第2次登顶

懂球帝 浏览 372

美国举起关税大棒持续施压 伊朗要给“难忘教训”

环球网资讯 浏览 249

泽连斯基"正装"设计师:衣服本不是为"特泽会"准备的

红星新闻 浏览 552

加里-麦卡利斯特:林德斯是纯粹的足球人;杰拉德还会再执教

懂球帝 浏览 348

苹果iPhone17发布前夜,深圳华强北抢先上市手机壳,郑州富士康员工:每天都在加班

时代财经 浏览 535

狼队主帅:我执教的6场比赛,踢到后面球队总是会自己崩盘

懂球帝 浏览 265
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4