关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报337人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普否认美军将领“反对与伊朗开战”

上观新闻 浏览 18

被问如何看待特朗普称泽连斯基是"独裁者" 外交部回应

澎湃新闻 浏览 577

换装高功率电机,蔚来 firefly 萤火虫新车申报

IT之家 浏览 168

小萨博尼斯适合勇士吗? 三大缺点阻碍他加盟

仰卧撑FTUer 浏览 145

限量30台 仰望U9X将于广州车展亮相

车质网 浏览 152

罗马诺:阿贾克斯即将与富安健洋签约半年,根据表现可能续约

懂球帝 浏览 143

深蓝汽车邓承浩否认“没钱了所以融资”:现金流非常好

IT之家 浏览 101

日本派大学生+以小打大仍5-0叙利亚 黄健翔惊叹 :夺世界杯非玩笑

我爱英超 浏览 96

《向往》收视创新低!仅剩0.19%越看越丧气,节目氛围遭吐槽

萌神木木 浏览 268

两种动力可选 全新雷克萨斯ES将于4月上市

车质网 浏览 59

配置升级 长安Lumin宝藏版将于10月30日上市

车质网 浏览 210

8月特斯拉欧洲多个市场销量持续暴跌:法瑞丹荷暴跌超 42%

IT之家 浏览 321

重温两次"夜间模式"的震撼 九三阅兵演练画面百看不厌

人民网-人民日报 浏览 305

马卡:吕迪格向自己扔胶带的裁判亲自道歉,对方也接受了他的道歉

直播吧 浏览 291

鸣鸣很忙明天上市:获腾讯淡马锡等2亿美元融资 市值将超800亿

雷递 浏览 69

满配华为全家桶 岚图追光L将上市

网易汽车 浏览 168

苹果发布iPhone 17e

澎湃新闻 浏览 0

邮报:纽卡中卫丹-伯恩遭遇肺穿孔和肋骨骨折,将缺阵六周

懂球帝 浏览 117

“豆腐靴”火了! 比马丁靴还好看, 早冬必穿!

Yuki女人故事 浏览 95

事关钓鱼岛、南海等问题 国防部最新回应

环球网资讯 浏览 86

固特异股价蒸发40%,百年轮胎帝国遭遇“中年危机”

轮胎报官方 浏览 375
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4