ncdc logo title
数据质量管理规范

  1 总则

  为保障国家冰川冻土沙漠科学数据中心(以下简称“中心”)寒区旱区科学数据的技术质量、科学严谨性与标准合规性,建立全生命周期、可审计、可追溯的数据质量管理体系,依据国务院办公厅印发《科学数据管理办法》,以及《数据质量》《信息技术 数据质量评价指标》等国家标准规范性文件,制定本规范。

  本规范适用于中心所有汇交、托管、归档、发布与共享的科学数据、元数据、数据产品及衍生资源,是中心数据质量控制、评估与持续改进的核心依据。

  2 质量目标与依据

  2.1 质量目标

  构建覆盖数据全生命周期的质量保证(QA)框架,确保数据真实、完整、规范、科学、可用,支撑高水平科研、工程建设与决策应用;通过透明化质量信息公开,支持用户自主评估数据质量与适用性。

  2.2 核心依据

  元数据标准:严格遵循ISO 19115地理信息元数据标准,兼容国家标准《科技平台资源核心元数据》(GB/T 30523-2023)和《信息技术 科学数据引用》(GB/T 35294-2017)数据引用规范,保障元数据的完整性与互操作性。

  流程规范:数据整理与质量控制活动遵循国内外通用数据治理规范,确保质控过程的一致性、可重复性与可追溯性。

  公开透明:所有质量标准、质控规则与评价指标均完整记录于公开发布的《数据质量管理办法》中,每年根据技术发展、用户反馈与科研需求更新优化。

  3 全生命周期质量控制流程

  3.1 提交前自动化智能质检

  数据集提交阶段,系统启动自动化合规性与异常识别双维度质控:

  基础合规性检查:自动扫描必填元数据完整性、文件格式合规性、命名规范及外部链接有效性,拦截形式不合格数据。

  深度异常识别:基于区间理论与机器学习算法,对数据空值、异常值、逻辑矛盾等问题进行自动统计与标记,提示提交者提前核查确认,降低人工审核成本。

  3.2 专业团队三级人工审核

  中心组建由地学领域专家与数据工程师构成的专业质量管理团队,围绕数据实体与元数据开展双向质量控制,建立三级审核机制:

  一级审核(形式审查):由专业管理人员开展人工核查,重点检查数据完整性、格式规范性、文件一致性与逻辑自洽性,确保数据满足入库基本条件。

  二级审核(内容审核):由2-3名对应领域资深数据专家开展深度复核,重点核查数据采集方法的合理性、处理流程的规范性、数据内容的科学性与结果的可靠性。

  三级质控(专题评审):采用“专家评审+专题审核会”模式,对关键数据集或存在争议的数据开展综合评定,形成明确的质量结论与改进意见。

  3.3 发布后动态质量监控

   数据集发布并非质量控制的终结,中心建立常态化动态监控与用户反馈机制:

  用户反馈渠道:通过在线评价系统、反馈入口、服务热线及用户交流群接收质量问题报告,实现问题快速触达。

  分级响应处理:所有上报问题由审核团队在3个工作日内响应:

  轻微元数据错误:直接修正并记录变更日志,同步更新数据集版本;

  一般质量问题:退回提交方并附详细修改意见,待重新提交后开展二次评估;

  重大质量问题或数据质量低劣:予以正式拒稿,并说明拒稿理由。

  4 关键质控技术与方法

  4.1 区块链溯源存证

  运用区块链技术实现数据完整性校验与来源溯源,目前相关系统已部署于3个数据管理平台、5类大型仪器设备,可为数据采集、处理、提交与审核全流程提供权威存证依据,保障数据不可篡改、可追溯。

  4.2 数据质量评价与记录留存

  所有质检规则、评价指标、审核记录与处理结果均成文留存,形成完整的质量档案。审核过程全程留痕,支持数据质量审计与回溯分析,为数据长期可信提供支撑。

  5 用户质量信息透明度

  为支持用户独立评估数据集质量与适用性,中心实行质量信息全公开:

  每个数据集详情页提供完整元数据记录,包括详细的方法学描述、数据采集流程、处理步骤、仪器校准信息及质量评价结果;

  公开质量管控方法、评价指标与合规标准,用户无需联系原始提交者,即可自主完成数据质量的深度评估;

  对数据质量等级、质控状态及历史修改记录进行标注,为用户选择数据提供清晰参考。

  6 附则

  本规范由国家冰川冻土沙漠科学数据中心负责制定、解释与更新,自发布之日起实施。中心定期对质量管理体系进行评估优化,确保数据质量持续满足科研与应用需求。