关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报402人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

秦昊带9岁女游国外,米饭百元自叹国内物价廉

松林侃世界 浏览 262

为“打击贩毒” 美军调派“福特”号航母至加勒比海

央视新闻客户端 浏览 212

白宫官员:欧洲在暗中破坏和谈 劝乌"再等等更好条件"

红星新闻 浏览 379

李想回应"理想MEGA造型像棺材":设计团队非常伤心

鲁中晨报 浏览 391

港股上市在即,奥克斯电气领跑家电“智造出海”时代,开启全球化新篇章

时代周报 浏览 12038

辽宁舰正常演训 日本为何炒作所谓“雷达照射”问题

澎湃新闻 浏览 180

“贝果夹克”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 231

特朗普:以色列与哈马斯签署"20点计划"第一阶段协议

央视新闻客户端 浏览 238

都体:迪马尔科恢复国米合练,弗拉泰西将力争出战都灵

直播吧 浏览 340

记者:U21联赛和U19中青赛合并为U20联赛,只是超龄球员数额不同

懂球帝 浏览 100

原来城里的名创优品长这样!那我以前逛的算什么?

Yuki女人故事 浏览 408

双子座流星雨即将引爆冬日夜空,成都“观星+”消费持续升温

红星新闻 浏览 202

新设计 兰博基尼Manifesto概念车官图发布

车质网 浏览 284

AI算力需求升级 国产算力迎持续发展窗口期

金证研 浏览 1168

32岁程序员猝死 公司谈判录音公布:我们非常器重他

澎湃新闻 浏览 88

朱媛媛遗作《小城大事》定档1月10日

阿淫记录生活日常 浏览 142

外卖,彻底变天!美团、京东、饿了么,都宣布了!

侃见财经 浏览 3475

豆瓣8.3,一场跨越三十年的迟到震撼审判!

幕味儿 浏览 280

三年半亏19亿,行政处罚超400条,享道出行IPO了

市值Observation 浏览 1218

美国:407类产品因含钢铝成分被加征额外关税 税率50%

央视新闻客户端 浏览 491

一千多人牺牲结局,无法改写,但于和伟临刑前一个动作,升华全剧

皮皮电影 浏览 248
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4