发布日期:2026-06-10 19:33点击次数:

国数据局印发《关于进行业质量数据集建设行动的实施案》,案提出,持续动数据标注先行先试。指批七个承担数据标注先行先试任务的城市,持续做强做数据标注产业。面向创新能力强、发展基础好、产业特优的地区,梯次布局批数据标注创新试验区。有序引具备条件的地区因地制宜开展试验区建设周口万能胶生产厂家,促进数据标注产业链上下游紧密协同,形成产业集聚应。培育批数据标注龙头企业、角兽企业、瞪羚企业,壮大数据标注产业。
国数据局关于印发《关于进行业质量数据集建设行动的实施案》的通知
国数科基〔2026〕25号
各省、自区、直辖市及新疆生产建设兵团数据管理部门:
现将《关于进行业质量数据集建设行动的实施案》印发给你们,请认真组织实施,加快进相关工作。
国数据局
2026年6月3日
关于进行业质量数据集建设行动的实施案
行业质量数据集是经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,能有提升模型能的行业数据的集,包含行业通识和行业识数据集。行业质量数据集是动“人工智能+”赋能千行百业、实现产业落地的基础、关键资源。为落实国民经济和社会发展“十五五”规划《纲要》,入实施“人工智能+”行动,动行业质量数据集建设广与“人工智能+”同频共振、互促共进,强化数据赋能人工智能创新发展,制定本案。
、总体要求
以习近平新时代特社会主义思想为指,入贯彻党的二十大和二十届历次全会精,落实“人工智能+”行动,主动顺应人工智能发展范式跃迁,按照“需求牵引、急用先行、应用验证、安全保障”原则,聚焦国民经济发展行业和战略新兴产业,围绕行业质量数据集供给、流通、应用等关键环节,部署强基扩容、标注攻坚、提质增、应用赋能、管理服务、价值释放六个项行动,形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”,加快构建数据要素与人工智能协同演进的共生生态。
到2028年底,建成批覆盖域、经过应用验证的行业质量数据集,造批数据驱动人工智能创新发展的典型应用场景,培育批具备先优势的创新型数据企业和业人才,形成批行业质量数据集建设工具和标准。数据从供给到价值释放的良循环基本形成,数据赋能人工智能创新发展的作用加凸显,数据产业与人工智能度融,持续催生智能经济新增长点。
二、实施强基扩容行动
顺应人工智能加速向行业渗透,从对话向多模态生成、决策执行、具身智能、物理交互等范式跃迁的趋势,拓宽数据供给渠道周口万能胶生产厂家,丰富数据供给类型,加快建设行业质量数据集,为人工智能发展和应用提供充足“燃料”。
()聚焦行业域进质量数据集建设。聚焦科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务、医疗卫生、教育教学、电子商务、人力资源、文化旅游、应急管理、气象服务、绿低碳、公共安全、城市理、住房建设、自然资源、社会信用等域,以及低空经济、具身智能、智能驾驶、智慧海洋、生物制造等创新域,加快进行业质量数据集建设。
(二)夯实行业质量数据集建设基础路径。梳理行业数据资源底数和应用场景,建立数据资源清单和数据集需求清单。以应用为牵引,持续进行业质量数据集建设先行先试,加快形成批可复制、可广的数据驱动型示范场景。强化链主单位牵引带动作用,支持链主单位以联体等形式动产业链上下游协同共建和资源整,持续扩大行业质量数据集供给规模,鼓励链主单位面向行业开放数据集并提供数据服务,赋能产业链上下游中小企业。鼓励等院校、科研院所、行业协会、数据流通服务机构、三业服务机构等各类主体参与行业质量数据集建设。加大公共数据资源开发利用力度,动公共数据与行业数据融利用,建设批质量数据集。
(三)面向人工智能应用需求丰富行业质量数据集建设形态。持续进文本、代码、图像、音频、、点云、时序数据、科学数据等多模态质量数据集建设,赋能人工智能预训练、指令微调、强化学习、测评等各阶段。加强知识库、知识图谱、本体等数据集建设,加快复杂任务规划、长程理、人机交互、决策执行等数据集建设,赋能智能体等新型智能应用形态。加快场景物理交互、环境感知、运动控制等真机交互数据集建设,积应用仿真模拟与成技术扩大数据供给,赋能具身智能发展。积面向世界模型等前沿向,进数据集建设。
(四)强化与数据基础设施建设有机联动。鼓励依托国数据基础设施,充分运用隐私保护计、可信数据空间等能力,开展数据集安全存储、可信流通、应用,动数据集从分散持有向集约化、标准化供给转变。鼓励探索建设支撑大规模、多模态数据集的数据基础设施存力中心。
三、实施标注攻坚行动
数据标注是将知识和经验注入到训练数据的过程,是行业质量数据集建设不可或缺的关键环节。引数据标注从“以人为主”向“人机协同、度参与”的多层次标注模式转变,动数据标注向业化、智能化跃升。
(五)动数据标注转型升。加强数据标注域科技创新,强化自动化工具和平台的研发与应用,发展“模型预标注+人工校准”“人工标注+模型检验”“模型预标注+模型检验”等智能化标注服务,提升数据标注水平。发展型数据标注服务,建立行业认证机制,动度参与指令微调、强化学习等阶段所需的业知识标注,生产域知识、逻辑理等质量数据集,提数据集的知识密度与业价值。
(六)持续动数据标注先行先试。指批七个承担数据标注先行先试任务的城市,持续做强做数据标注产业。面向创新能力强、发展基础好、产业特优的地区,梯次布局批数据标注创新试验区。有序引具备条件的地区因地制宜开展试验区建设,促进数据标注产业链上下游紧密协同,形成产业集聚应。培育批数据标注龙头企业、角兽企业、瞪羚企业,壮大数据标注产业。
(七)扩大数据标注人才供给。支持有条件的院校增设数据标注相关课程,依托产教融、校企协同等式,培育具备业知识的数据标注人才。鼓励开展数据标注职业技能等认定,强化继续教育与在职培训,畅通人才发展通道。完善分层分类人才评价体系,建设职与兼职相结的业标注人才队伍。鼓励校毕业生等群体参与标注工作,通过灵活就业、项目协作、多元岗位供给等式,扩展就业渠道。
四、实施提质增行动
动构建符结构完整、内容多样、标注准确、模型适配等质量标准、满足人工智能就绪(AI-Ready)的质量数据集,降低训练理成本,有提升模型能。
(八)提升行业质量数据集建设质。加强数据清洗、增强、标注、对齐、质检等关键技术攻关和全过程自动化工具研发应用,支撑率、标准构建行业质量数据集。针对行业特定应用场景,鼓励运用数据智能过滤与配比等技术,构建精、强的知识密度数据集,降低训练理成本。发挥数据成在数据集建设中的积作用,利用模型、仿真系统等生成的数据,解决稀缺场景数据集构造难、真实场景数据采集成本等问题。
(九)动质量数据集标准体系建设和应用落地。加快进质量数据集格式、类型、标注、质量测评等相关国标准研制、应用验证和贯标周口万能胶生产厂家,健全质量数据集标准体系。鼓励各行业、各地与国标准联动,动行业域质量数据集标准研制。加强在产业政策、政府采购、招投标中引用相关标准,引产业执行水平标准,用好检验检测等手段动标准实施,促进质量数据集规范化建设。
(十)强化质量数据集质量测评和结果互认。持续完善“数据质量验证+模型应用反馈”的测评法,加快建设覆盖多行业、多场景、多模态的测评数据集,有评估质量数据集应用果。发起质量数据集测评联行动倡议,动相关单位按照标准,采用统测评案和工具开展测评和封装工作,实现“次测评、全国互认”。
五、实施应用赋能行动
坚持行业质量数据集建设与实际应用度融,以模引数、用数赋模,万能胶厂家促进质量数据集建设与“数据要素×”“人工智能+”同频共振,赋能产业数智化转型。
(十)造“数据飞轮”应用闭环。以模型应用牵引数据供给、以数据赋能模型迭代,动形成“场景—数据—模型”协同发展的良循环。发挥“人工智能+”场景牵引作用,动数据供给和场景的匹配,以用促建,以实际需求吸引多数据资源汇聚,动行业质量数据集有供给和持续优化。结“数据要素×”行动,化行业质量数据集建设,以建促用,充分利用模型应用产生的动态交互数据等,驱动行业模型能力持续提升。
(十二)造行业应用标杆和典型案例。着力造集“数据集生产加工和流通利用、支撑模型训练应用”于体的数据赋能工场,造批行业标杆,加速人工智能应用落地。造批数据赋能智能体解决实际问题的典型案例,动质量数据集规模化应用。
(十三)繁荣数据集协同发展生态。加强统筹协调,强化部门联动,分行业分域有序进质量数据集建设和应用。搭建“政产学研用金”多交流平台,形成共建共享、互利共赢的产业生态,破解“数据孤岛”“数据烟囱”。常态化举办供需对接活动,提升供需匹配率,促进实质作落地。组织遴选行业质量数据集建设和应用典型案例,发挥行业示范引作用。支持举办行业质量数据集创新赛事活动,以赛促建、以赛促用。化交流作,建立健全数据集跨境安全有序流动机制,动跨境流动规则互认,鼓励行业质量数据集建设主体积参与全球数据生态建设。
六、实施管理服务行动
加强数据集管理,完善数据伦理和理机制,动落实数据权益相关制度,进数据集建设体系加规范有序。
(十四)构建数据集全生命周期的管理体系。加强覆盖数据采集、清洗、加工、标注、质检、测评、迭代、审计等全生命周期的数据集管理服务能力建设,依托数据基础设施,强化隐私保护计、区块链等技术应用,确保数据可管、可控、可追溯。建设“物理分散、逻辑集中”的国数据集管理服务系统,实现数据集目录、供需等信息互联互通。支持各地、行业依托国系统设置区,支持已有系统与国系统对接。
(十五)探索面向人工智能发展的数据相关制度。落实数据持有权、使用权、经营权三权分置制度。研究成数据等新情况新问题。兼顾产权保护与创新发展需求,完善人工智能训练阶段数据使用规则,动版权作品数据等有序用于模型训练,完善数据授权使用机制和收益分配规则,造权责清晰、规包容的制度环境。
(十六)坚持伦理先行与公平普惠。研究探索质量数据集伦理道德规范,坚持有益社会的价值向,严禁非法收集或使用敏感数据。范数据集建设全流程产生数据偏见与歧视,充分考虑社会各界多元需求,大限度确保数据集建设成果惠及全民。
七、实施价值释放行动
发挥数据集的应用价值,以行业质量数据集赋能人工智能发展。释放数据要素价值,动数据集商业化、资产化,培育为数据付费的市场共识,探索以词元(Token)为基础的价值体系。
(十七)发挥行业质量数据集的应用价值。建立数据集和模型需求对接机制,动行业质量数据集和模型适配,提模型质量和率,度赋能行业发展。动行业质量数据集跨行业、跨域、跨场景融利用,鼓励“以数换数”“数模互换”“数据托管”“数体”等多种应用模式。积参与开源社区建设,鼓励中介机构、公益机构将基础、公益数据集作为公共产品向社会公开,激发用数活力。
(十八)创新行业质量数据集商业模式。完善数据集长运营机制,鼓励数据集在数据交易所(中心)等数据流通服务机构挂交易,发展“订阅模式”“商场模式”“定制模式”等多元服务形态,动商业模式从基础数据包销售向API调用、模型化解决案及全栈服务梯次跃升。探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据价值体系。
(十九)探索行业质量数据集资产化创新路径。鼓励有条件的单位率先探索开展数据集资产盘点、登记、评估等试点工作,为数据资产化积累可复制、可广的经验。鼓励探索数据集质押融资、作价入股、资产证券化、数据信托、数据保险等多元资产化创新模式,拓宽数据价值转化渠道。
(二十)培育为质量数据付费的市场共识。建立健全市场化利益分配机制,确保数据供给、加工、流通、应用等各环节主体均能获得市场化价值回报,共享数据红利。鼓励数据需求通过购买、作等形式加大投入,充分发挥政府部门、国有企业、模型企业等单位的示范引作用,动数据采买纳入预编制,率先开展数据采购实践,带动形成数据有偿使用市场共识,构建健康可持续的数据市场生态。
八、保障措施
国数据局发挥统筹协调作用,会同有关部门协同进质量数据集建设与应用,构建“部门协同、域联动”的工作格局。各地要落实属地管理责任,加大组织实施力度,避哄而上,止同质化、低水平重复建设,结实际制定配套措施,统筹安排数据产品和服务采购经费,用于支持行业质量数据集建设。支持各类主体以应用为牵引,积开展和参与行业质量数据集建设。引金融机构、耐心资本、产业基金等,加大对行业质量数据集建设的投资力度,鼓励地设立项资金,探索多元化、多渠道投入机制。鼓励在依法依规、风险可控前提下开展创新探索。持续跟踪行业质量数据集建设工作,完善监测指标,评估建设和应用成,阶段总结经验。强化安全保障,落实数据安全相关法律法规要求,建立全流程安全理机制,范数据投毒与污染、数据泄露等安全风险,守牢数据安全底线。 举报 文章作者
财资讯 相关阅读 国层面次系统部署,六大行动引爆行业质量数据集建设
质量数据集成为数智化转型的“新型燃料”。 6 15428 昨天 10:04 盘前读丨质量数据集建设按下“加速键”;美股芯片股全线
机构认为,短期低切趋势加剧A股波动,科技成长仍是中长期主线。 33067 昨天 07:57 温州服务业质量发展:数据驱动业态迭代
温州正朝着服务赋能、产城融的向加速转型,服务业成为动城市质量发展的中坚力量。 455 06-01 14:08 词元经济站上风口,国数据局明确两大发力点
三运营商陆续出词元套餐,动AI力从机房属资源变成像流量样可订阅、可按量消费的公共服务。 19117 05-24 19:53 多地密集部署质量数据集建设,将工业数据变成数智化“燃料”
质量数据集就像经过精炼加工的“标号燃油”,在很大程度上,决定着人工智能技术在制造业应用中能否跑得稳、跑得远、跑出益。 7709 05-14 20:04 财热 点击关闭相关词条:设备保温 塑料挤出机厂家 预应力钢绞线 玻璃丝棉 万能胶厂家
奥力斯 泡沫板橡塑板专用胶报价 联系人:王经理 手机:18232851235(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定周口万能胶生产厂家,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
18232851235