关闭广告

吴世忠谈数据集建设:合法性监管是第一道防线,不能失守

南方都市报519人阅读

“当前全球人工智能正加速从感知智能向认知智能跃迁,大模型作为核心载体,其能力边界几乎完全由数据的质量、规模和安全性决定。数据不仅是模型训练的基础,更直接影响知识结构、表达能力和文化传承,高质量数据集建设是人工智能发展的基础工程和战略任务。”吴世忠说道。



8月28日,在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,中国工程院院士吴世忠围绕大模型数据集建设分享了一些思考。

吴世忠表示,大模型的逻辑推理、复杂指令遵循以及各种智能涌现,都依赖于海量、多样和高质量的训练数据。五年前GPT-3推出时使用的是数千亿级的文本数据,如今国内外头部模型的训练数据已经迈入万亿级门槛。数据集不仅是模型的训练素材,更是真实世界的模拟环境,数据的广度决定模型的认知、知识边界,标注质量影响模型水平。

“可以说,没有优质的数据集,再先进的算法也难以突破智能边界,再强大的算力底座也可能出现无米之炊,更难以支撑人工智能迈向通用智能的终极目标。”吴世忠说道。

从政策层面看,数据集建设已经明确纳入我国人工智能发展的战略规划和顶层设计。国务院

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以硬核智能定义超值神车 尚界H5交付破10000台

网易汽车 浏览 380

日政坛震荡首相或换人 石破茂一句话判高市早苗"死刑"

北回归线 浏览 237

极端寒潮冲击美国电力系统,芝加哥电价为何跌入负值?

国际金融报 浏览 814

波利塔诺:我们应铭记输给埃因霍温,提醒自己要一直全力以赴

懂球帝 浏览 366

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 306

以防长威胁伊朗:准备好重启战事 就等美国“开绿灯”

上观新闻 浏览 87

低价"银行直供房"激增 有房产价格低于市价25%

第一财经资讯 浏览 319

北京拿下“五万亿之城”,为何还成了AI之城?

BT财经 浏览 5994

姚期智:“AI+量子”将极大拓展人类计算能力边界

文汇报 浏览 421

特斯拉申报Model Y长续航后驱版 又是一个走量款

网易汽车 浏览 360

智己汽车2025全年销售81,017台 创历史新高

网易汽车 浏览 261

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 247

第五代骁龙8之后,旗舰机有了新的“标准版”

科技行者 浏览 330

河南最大城商行迎博士行长,曾任濮阳副市长、为湖南大学校友

湘财Plus 浏览 753

最强越野车!搭载3.0T V6引擎 涉水深度900mm

隔壁说车老王 浏览 246

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 1159

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 1510

巴解组织高级官员:哈马斯回应“20点计划”是负责任做法

环球网资讯 浏览 373

女子手机突然预警陌生人在家偷东西 男子看见监控懵了

环球网资讯 浏览 243

特朗普取消美方代表赴巴基斯坦行程

上观新闻 浏览 74

天啊!看到林志玲和小13岁刘亦菲同框,才懂王晶为啥说她很一般了

温柔娱公子 浏览 359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4