关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报421人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

博时基金“换帅”

国际金融报 浏览 1018

昔日巨头接连受挫,领先只剩1-3年,日本功率芯片遭遇中国价格战

网易科技报道 浏览 412

新华社权威快报|我国生成式人工智能用户规模超5亿

新华社 浏览 280

英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无声世界

IT之家 浏览 619

苹果iPad Air M4新增支持802.11be无线局域网技术/蓝牙6.0

IT之家 浏览 91

台媒:大陆在朱日和基地复制"总统府" 不可掉以轻心

经济观察报 浏览 150

特朗普邀请普京加入和平委员会:他办实事 影响力巨大

澎湃新闻 浏览 126

低成本、高锐度布局风口上的创新药

一地基毛 浏览 1359

U17世界杯吉祥物灵感来自前国足主帅米卢,米卢:感谢这个创意

懂球帝 浏览 250

卫冕失败!哈登观战自由人1-2水星首轮游 WNBA半决赛对阵出炉

醉卧浮生 浏览 303

空间更宽敞 奔驰纯电GLC七座版实车曝光

车质网 浏览 213

铜铜铜,快要高攀不起了

每日资本论 浏览 1042

英伟达CES亮出新牌

北京商报 浏览 174

韩国知名潮牌宣布将关闭中国全部门店 陆续打折清仓

潇湘晨报 浏览 260

特朗普:将取消一些制裁 以平抑国际油价

环球网资讯 浏览 70

从北京到平壤的火车线路被指将于周四开通 外交部回应

外交部网站 浏览 65

西贝的新考题:如何券后留客

北京商报 浏览 5999

红魔授权服务中心・售后网点最新进展公布,覆盖全国62城

IT之家 浏览 230

比小说更魔幻!前华人首富,为何被特朗普特赦

说财猫 浏览 1270

男子驾车撞死闯国道野猪被判全责 特斯拉修车费超2万

红星新闻 浏览 255

止步“五连涨”!美股12月“开门黑”

中新经纬 浏览 2849
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4