1 总则
为规范中心数据全生命周期存储管理,保障冰川、冻土、沙漠及寒旱区相关科学数据的长期完整性、可用性、真实性与安全性,建立标准化、可追溯、高可靠的存储与保存体系,依据《中华人民共和国数据安全法》《科学数据管理办法》及中心相关管理制度,制定本政策。
本政策适用于中心所有数据与元数据的存储架构规划、备份管理、介质运维、完整性校验、风险防控及数据删除等全环节工作,是中心开展数据存储与长期保存管理的核心依据。
2 全生命周期流程管理
2.1 标准化文件化管理
数据全生命周期提交与管理流程实现标准化、文件化、闭环化,覆盖数据汇交方案制定、成果数据整理、线上提交、多级审核、数据汇聚、公开发布共享,以及后期运维、版本更新与用户服务等全环节,确保每一项工作均有章可循、有据可查。
2.2 制度化执行规范
中心所有存储管理与数据完整性保障工作,严格遵循成文流程与内部正式管理规范执行,专项管理制度文件包括《存储分区规划规范》《服务器运维规程》《日常运维管理条例》。文件清晰界定所有物理及逻辑存储位置、分区功能、访问权限与日常管理准则,确保工作人员全面掌握各存储区域的管理要求与标准操作流程。
3 存储架构与多副本策略
3.1 多层级冗余存储体系
数据中心NCDC 构建了基于多层级冗余架构的存储体系,依托完善的风险管理与介质监测机制,保障数据在物理层面的绝对安全。实施严格的“在线+离线+异地”多副本存储策略,从物理层面保障数据绝对安全。
在线双机热备:核心数据采用双机热备架构,确保在主节点故障时业务无感知切换,实现高可用性。
离线冷备份:建立独立离线冷备份系统,防范逻辑错误、勒索病毒攻击等导致的数据损毁。
异地容灾副本:搭建异地容灾存储体系,应对区域性自然灾害或重大基础设施故障。
3.2 常态化备份机制
日常归档采用成熟备份机制,实现数据与元数据全面冗余留存:
(1)增量备份:新增数据执行每日增量备份,高效同步更新数据;
(2)全量备份:全量资源库执行每周完整备份,保障整体数据完整可恢复。
4 风险管理与介质运维
4.1 常态化风险防控
依托完善的风险管理体系支撑多副本落地执行:
(1)定期开展存储风险评估,排查硬件故障、存储介质老化、人为误操作、系统异常等潜在隐患;
(2)提前制定应急处置方案与风险应对措施,降低长期存储安全风险,保障存储体系持续稳定运行。
4.2 介质全周期监测
建立常态化介质监测与运维流程,应对存储介质老化损耗问题:
(1)技术团队定期开展硬件巡检、存储介质健康检测、磁盘寿命监控与设备性能评估;
(2)对老化、性能衰减的存储载体,及时开展介质迁移、硬件更换与格式适配,杜绝因介质老化损坏造成的数据丢失或文件损坏。
5 数据完整性管理与校验
5.1 全阶段固定性校验
从数据汇交、长期存储到用户访问全阶段,常态化开展固定性(Fixity)完整性校验,保障数据内容无损、未被篡改。
哈希校验:在数据摄入阶段,系统为每个单独文件生成哈希值(如 SHA-256),并将其永久存储。在长期的保存过程中,系统定期开展哈希值比对与完整性巡检。
异常处置:一旦发现检测到非正常改动或文件损坏,系统可立即从冗余备份中恢复原始正确版本。
5.2 全程审计留痕
所有完整性检查、异常处置及数据恢复操作,均永久记录于不可修改的审计日志,日志在数据集全生命周期内持续保留,确保校验与恢复过程可追溯、可审计。
5.3 数据删除管控
(1)数据与元数据删除操作受严格成文流程管控,严禁私自、随意删除。
(2)任何数据删除须提交正式申请,经管理与技术层级审批后方可执行。
(3)所有操作全程台账记录,留存删除原因、审批信息、操作时间、操作人等完整资料,确保数据删除仅通过合规审批、全程留痕的标准化流程开展。
6 附则
本政策由国家冰川冻土沙漠科学数据中心负责解释、修订,自发布之日起实施。中心将根据技术发展、风险防控需求及业务优化,适时更新完善相关管理制度,持续提升数据存储与长期保存管理水平。