ncdc logo title
数据长期保存策略

1 总则与目的

1.1 为保障国家冰川冻土沙漠科学数据中心(以下简称“中心”)科学数据资源的真实性、完整性、可用性、可追溯性与长期可读性,依据《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》《科学数据管理办法》及国家公共数据开放共享相关制度规定,结合寒区旱区冰川、冻土、沙漠、积雪、生态、灾害、工程等领域数据特性,制定本策略。

1.2 本策略旨在建立覆盖数据全生命周期的长期保存、风险防控、格式演进、版本管理与业务连续性体系,确保数据资源长期可复用、可管理、可服务。

1.3 本策略适用于中心汇交、归档、发布、共享的所有科学数据、元数据、质量记录、方法文档、模型工具及衍生数据产品。

2 法定依据与使命

2.1 中心作为国家级学科领域科学数据中心,承担国家寒区旱区科学数据长期保存、规范治理与开放共享法定职责。

2.2 遵循FAIR数据原则与开放档案信息系统参考模型(OAIS),实现数据可发现、可访问、可互操作、可复用。

2.3 坚持开放为原则、受控为例外,对涉密、敏感、未公开成果实行分级管控与保存。

3 保存范围

3.1 基础观测数据:野外观测、台站监测、遥感反演、试验实验、考察调查数据。

3.2 专题数据产品:生态修复、灾害监测、沙漠与荒漠化、水土保持、冰冻圈变化数据。

3.3 管理型数据:元数据、数据管理计划、质量控制报告、处理流程、版本记录。

3.4 数字对象:模型、算法、工具软件说明、可复现流程、引用与许可信息。

3.5 保存对象一经归档,原则上永久留存、不删除、不销毁。

4 核心保存原则

4.1 真实性原则:保障数据来源、产生过程、内容与版本可追溯。

4.2 完整性原则:数据与配套元数据、文档同步保存。

4.3 可读性原则:优先采用开放、非专有、长期稳定格式。

4.4 安全性原则:多副本、异地备份、校验核验、防篡改、可审计。

4.5 合规性原则:遵守知识产权、隐私保护、数据分级分类要求。

5 元数据与持久标识管理

5.1 以完整元数据作为长期保存基础,统一采用ISO 19115标准。

5.2 元数据包含来源、时空范围、方法、质量、权属、许可、变更历史等保存元数据。

5.3 正式发布数据集统一分配DOI持久标识符和中国科技资源(CSTR)标识,确保长期可引用、可定位。

5.4 元数据实行版本化管理,变更全程留痕、可审计追溯。

6 数据格式管理与演进

6.1 优先归档格式:NetCDF、GeoTIFF、Shapefile、CSV、TXT、XML、JSON、PDF。

6.2 专有格式须转换为开放格式,或保留配套读取工具与环境说明。

6.3 建立格式风险评估机制,定期开展濒危格式迁移与再造。

6.4 格式迁移不得改变数据内容、精度与结构,迁移过程记录入档。

7 数据质量与校验

7.1 归档前执行完整性校验、格式校验、固定值校验(Checksum/MD5/SHA256)。

7.2 归档后按季度执行固定值核验,确保数据未篡改、未损坏。

7.3 质量记录、质控流程、质控结果与数据集同步保存。

8 版本管理

8.1 数据集发布后建立正式版本号,旧版本永久归档,不删除、不覆盖。

8.2 数据修订、增补、纠错均以新版本发布,附变更说明。

8.3 DOI和CSTR永久指向对应版本,确保引用可复现。

9 备份与存储架构

9.1 执行3-2-1备份策略:至少3份副本、2类介质、1份异地备份。

9.2 采用在线存储+近线归档+离线备份+异地容灾四层架构。

9.3 主存储、备份存储、云备份、离线磁带/对象存储多级冗余。

9.4 敏感与涉密数据实行加密存储、逻辑隔离、独立备份。

10 长期保存技术措施

10.1 存储系统采用冗余架构、故障自愈、定期巡检与性能监控。

10.2 建立介质更新与技术迭代机制,避免软硬件过时导致不可读。

10.3 建立保存元数据库,记录存储位置、副本状态、迁移历史、介质寿命。

10.4 对超长期归档数据实行周期性可读性检测。

11 业务连续性与应急接续

11.1 制定灾难恢复预案,明确恢复点目标(Recovery Point Objective,RPO)与恢复时间目标(Recovery Time Objective,RTO)指标,每年开展应急演练。

11.2 建立数据托管与接续机制,若中心无法存续,数据移交至国家指定可信仓储机构。

11.3 核心数据同步镜像至国家级科学数据备份中心,保障永久存续。

12 知识产权与权益保障

12.1 数据知识产权与著作权归数据生产者与依托单位所有。

12.2 公开数据采用CC BY 4.0许可,敏感数据实行受控授权访问。

12.3 所有保存活动保障数据提交者、使用者、托管方法定权责。

13 责任体系

13.1 中心:承担长期保存、运维、安全与服务主体责任。

13.2 依托单位:提供经费、设施、人员与组织保障。

13.3 数据提交者:对数据真实性、合法性、质量与权属负责。

13.4 技术团队:负责存储、备份、校验、迁移与应急恢复。

14 监督、审查与更新

14.1 本策略每3年全面评审一次,根据技术演进、法规更新与认证要求动态修订。

14.2 接受主管部门、专家咨询委员会审核。

14.3 保存执行情况纳入年度数据中心运行报告。