1.1 为保障国家冰川冻土沙漠科学数据中心(以下简称“中心”)科学数据资源的真实性、完整性、可用性、可追溯性与长期可读性,依据《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《科学数据管理办法》及国家公共数据开放共享相关制度规定,结合寒区旱区冰川、冻土、沙漠、积雪、生态、灾害、工程等领域数据特性,制定本策略。
1.2 本策略旨在建立覆盖数据全生命周期的长期保存、风险防控、格式演进、版本管理与业务连续性体系,确保数据资源长期可复用、可管理、可服务。
1.3 本策略适用于中心汇交、归档、发布、共享的所有科学数据、元数据、质量记录、方法文档、模型工具及衍生数据产品。
2.1 中心作为国家级学科领域科学数据中心,承担国家寒区旱区科学数据长期保存、规范治理与开放共享法定职责。
2.2 遵循FAIR数据原则与开放档案信息系统参考模型(OAIS),实现数据可发现、可访问、可互操作、可复用。
2.3 坚持开放为原则、受控为例外,对涉密、敏感、未公开成果实行分级管控与保存。
3.1 基础观测数据:野外观测、台站监测、遥感反演、试验实验、考察调查数据。
3.2 专题数据产品:生态修复、灾害监测、沙漠与荒漠化、水土保持、冰冻圈变化数据。
3.3 管理型数据:元数据、数据管理计划、质量控制报告、处理流程、版本记录。
3.4 数字对象:模型、算法、工具软件说明、可复现流程、引用与许可信息。
3.5 保存对象一经归档,原则上永久留存、不删除、不销毁。
4.1 真实性原则:保障数据来源、产生过程、内容与版本可追溯。
4.2 完整性原则:数据与配套元数据、文档同步保存。
4.3 可读性原则:优先采用开放、非专有、长期稳定格式。
4.4 安全性原则:多副本、异地备份、校验核验、防篡改、可审计。
4.5 合规性原则:遵守知识产权、隐私保护、数据分级分类要求。
5.1 以完整元数据作为长期保存基础,统一采用ISO 19115标准。
5.2 元数据包含来源、时空范围、方法、质量、权属、许可、变更历史等保存元数据。
5.3 正式发布数据集统一分配DOI持久标识符和中国科技资源(CSTR)标识,确保长期可引用、可定位。
5.4 元数据实行版本化管理,变更全程留痕、可审计追溯。
6.1 优先归档格式:NetCDF、GeoTIFF、Shapefile、CSV、TXT、XML、JSON、PDF。
6.2 专有格式须转换为开放格式,或保留配套读取工具与环境说明。
6.3 建立格式风险评估机制,定期开展濒危格式迁移与再造。
6.4 格式迁移不得改变数据内容、精度与结构,迁移过程记录入档。
7.1 归档前执行完整性校验、格式校验、固定值校验(Checksum/MD5/SHA256)。
7.2 归档后按季度执行固定值核验,确保数据未篡改、未损坏。
7.3 质量记录、质控流程、质控结果与数据集同步保存。
8.1 数据集发布后建立正式版本号,旧版本永久归档,不删除、不覆盖。
8.2 数据修订、增补、纠错均以新版本发布,附变更说明。
8.3 DOI和CSTR永久指向对应版本,确保引用可复现。
9.1 执行3-2-1备份策略:至少3份副本、2类介质、1份异地备份。
9.2 采用在线存储+近线归档+离线备份+异地容灾四层架构。
9.3 主存储、备份存储、云备份、离线磁带/对象存储多级冗余。
9.4 敏感与涉密数据实行加密存储、逻辑隔离、独立备份。
10.1 存储系统采用冗余架构、故障自愈、定期巡检与性能监控。
10.2 建立介质更新与技术迭代机制,避免软硬件过时导致不可读。
10.3 建立保存元数据库,记录存储位置、副本状态、迁移历史、介质寿命。
10.4 对超长期归档数据实行周期性可读性检测。
11.1 制定灾难恢复预案,明确恢复点目标(Recovery Point Objective,RPO)与恢复时间目标(Recovery Time Objective,RTO)指标,每年开展应急演练。
11.2 建立数据托管与接续机制,若中心无法存续,数据移交至国家指定可信仓储机构。
11.3 核心数据同步镜像至国家级科学数据备份中心,保障永久存续。
12.1 数据知识产权与著作权归数据生产者与依托单位所有。
12.2 公开数据采用CC BY 4.0许可,敏感数据实行受控授权访问。
12.3 所有保存活动保障数据提交者、使用者、托管方法定权责。
13.1 中心:承担长期保存、运维、安全与服务主体责任。
13.2 依托单位:提供经费、设施、人员与组织保障。
13.3 数据提交者:对数据真实性、合法性、质量与权属负责。
13.4 技术团队:负责存储、备份、校验、迁移与应急恢复。
14.1 本策略每3年全面评审一次,根据技术演进、法规更新与认证要求动态修订。
14.2 接受主管部门、专家咨询委员会审核。
14.3 保存执行情况纳入年度数据中心运行报告。