关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报30人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

越跌越买!科创主题ETF份额下半年增超400亿份

每日经济新闻 浏览 6977

马斯克将拍卖“推特”相关物品 包括建筑物上蓝鸟标志

财联社 浏览 5944

电动车充完电不开,一天还能挣好几百?

小李车评李建红 浏览 53

泫雅疑官宣恋情!与龙俊亨同步发牵手照,想要支持,公司:确认中

文艺圈娱乐号 浏览 4572

市监总局:规范新能源汽车检测收费 严查违法行为

中国经济网 浏览 11511

中国脑机接口发展提速:“机智”上新,从实验室走向市场

第一财经资讯 浏览 2093

续航达600km,路特斯EMEYA将于1月18日上市

天天汽车 浏览 4237

这四件外套,承包冬天90%的时髦

Yuki女人故事 浏览 4390

标配雷神EM-P超级电混 吉利银河星耀8曝光

网易汽车 浏览 257

汪小菲返台现身机场,精神状态恢复不少,细节体现马筱梅的聪明

萌神木木 浏览 269

德章泰-穆雷、吹羊、杰伦-约翰逊同砍至少25分5助 老鹰队史首次

直播吧 浏览 4251

从狂飙到猛踩刹车,动力电池行业洗牌加剧

第一财经资讯 浏览 11745

各地丰富供给、释放消费新潜力 为促消费扩内需蓄能加力

环球网资讯 浏览 8279

30.88万起的蔚来ES8又要成爆款!股价一夜暴涨超9%

电动邦 浏览 34

媒体:马克龙因"法国18年来最严重骚乱"面临严峻危机

上观新闻 浏览 47709

特警押解李小龙指认现场 邻居称其用石头砸伤前妻致死

红星新闻 浏览 32238

他一夜干出2个英特尔,风头盖过马斯克

华商韬略 浏览 9105

京东重启低价策略,“百亿补贴”会是对抗拼多多的良药吗?

财联社 浏览 11006

女子登山骨折花6万找10人抬下山:他们开的价 我没还价

扬子晚报 浏览 58

红布林618升级用户体验:回收加价17%、零手续费

网易科技报道 浏览 8231

中国最神秘千亿独角兽,难解「砍一刀」

豹变 浏览 12262
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4