1 总则
为保障国家冰川冻土沙漠科学数据中心(以下简称“中心”)寒区旱区科学数据的技术质量、科学严谨性与标准合规性,建立全生命周期、可审计、可追溯的数据质量管理体系,依据国务院办公厅印发《科学数据管理办法》,以及《数据质量》《信息技术 数据质量评价指标》等国家标准规范性文件,制定本规范。
本规范适用于中心所有汇交、托管、归档、发布与共享的科学数据、元数据、数据产品及衍生资源,是中心数据质量控制、评估与持续改进的核心依据。
2 质量目标与依据
2.1 质量目标
构建覆盖数据全生命周期的质量保证(QA)框架,确保数据真实、完整、规范、科学、可用,支撑高水平科研、工程建设与决策应用;通过透明化质量信息公开,支持用户自主评估数据质量与适用性。
2.2 核心依据
元数据标准:严格遵循ISO 19115地理信息元数据标准,兼容国家标准《科技平台资源核心元数据》(GB/T 30523-2023)和《信息技术 科学数据引用》(GB/T 35294-2017)数据引用规范,保障元数据的完整性与互操作性。
流程规范:数据整理与质量控制活动遵循国内外通用数据治理规范,确保质控过程的一致性、可重复性与可追溯性。
公开透明:所有质量标准、质控规则与评价指标均完整记录于公开发布的《数据质量管理办法》中,每年根据技术发展、用户反馈与科研需求更新优化。
3 全生命周期质量控制流程
3.1 提交前自动化智能质检
数据集提交阶段,系统启动自动化合规性与异常识别双维度质控:
基础合规性检查:自动扫描必填元数据完整性、文件格式合规性、命名规范及外部链接有效性,拦截形式不合格数据。
深度异常识别:基于区间理论与机器学习算法,对数据空值、异常值、逻辑矛盾等问题进行自动统计与标记,提示提交者提前核查确认,降低人工审核成本。
3.2 专业团队三级人工审核
中心组建由地学领域专家与数据工程师构成的专业质量管理团队,围绕数据实体与元数据开展双向质量控制,建立三级审核机制:
一级审核(形式审查):由专业管理人员开展人工核查,重点检查数据完整性、格式规范性、文件一致性与逻辑自洽性,确保数据满足入库基本条件。
二级审核(内容审核):由2-3名对应领域资深数据专家开展深度复核,重点核查数据采集方法的合理性、处理流程的规范性、数据内容的科学性与结果的可靠性。
三级质控(专题评审):采用“专家评审+专题审核会”模式,对关键数据集或存在争议的数据开展综合评定,形成明确的质量结论与改进意见。
3.3 发布后动态质量监控
数据集发布并非质量控制的终结,中心建立常态化动态监控与用户反馈机制:
用户反馈渠道:通过在线评价系统、反馈入口、服务热线及用户交流群接收质量问题报告,实现问题快速触达。
分级响应处理:所有上报问题由审核团队在3个工作日内响应:
轻微元数据错误:直接修正并记录变更日志,同步更新数据集版本;
一般质量问题:退回提交方并附详细修改意见,待重新提交后开展二次评估;
重大质量问题或数据质量低劣:予以正式拒稿,并说明拒稿理由。
4 关键质控技术与方法
4.1 区块链溯源存证
运用区块链技术实现数据完整性校验与来源溯源,目前相关系统已部署于3个数据管理平台、5类大型仪器设备,可为数据采集、处理、提交与审核全流程提供权威存证依据,保障数据不可篡改、可追溯。
4.2 数据质量评价与记录留存
所有质检规则、评价指标、审核记录与处理结果均成文留存,形成完整的质量档案。审核过程全程留痕,支持数据质量审计与回溯分析,为数据长期可信提供支撑。
5 用户质量信息透明度
为支持用户独立评估数据集质量与适用性,中心实行质量信息全公开:
每个数据集详情页提供完整元数据记录,包括详细的方法学描述、数据采集流程、处理步骤、仪器校准信息及质量评价结果;
公开质量管控方法、评价指标与合规标准,用户无需联系原始提交者,即可自主完成数据质量的深度评估;
对数据质量等级、质控状态及历史修改记录进行标注,为用户选择数据提供清晰参考。
6 附则
本规范由国家冰川冻土沙漠科学数据中心负责制定、解释与更新,自发布之日起实施。中心定期对质量管理体系进行评估优化,确保数据质量持续满足科研与应用需求。