多年冻土的存在与分布不仅深刻影响地表能量平衡、水文过程和生态系统稳定性,还控制着全球陆地碳储量的动态演化,是评估气候变化影响与碳排放反馈机制的关键基础。基于1749个多年冻土与非多年冻土站点,融合气温、降水、积雪日数、海拔、土壤属性等多源高分辨率环境因子,采用最优特征组合和随机森林模型进行建模预测。模型经40次5折交叉验证评估,准确率达到0.936,F1值为0.936,具有良好的泛化性能。在此基础上构建了覆盖欧亚大陆的多年冻土分布数据集,提供2000、2005、2010、2015和2020年五个时段的空间预测结果,空间分辨率为1 km。数据集生成的多年冻土分布图在空间上连续性良好,能够准确反映高纬与高海拔地区的冻土分布格局。该数据可为冻土变化分析、碳释放风险评估、区域气候响应模拟和生态环境监测提供基础支撑。
采集时间 | 2000/01/01 - 2020/12/31 |
---|---|
采集地点 | 亚欧大陆区域 |
数据量 | 12.4 MiB |
数据格式 | GeoTIFF |
数据空间分辨率(/米) | 1千米 |
数据时间分辨率 | 5年 |
坐标系 | WGS84 |
整合了多个公开数据库与文献记录中的多年冻土及非多年冻土站点数据,主要来源包括:全球陆地多年冻土监测网络(GTN-P);藏北高原冰冻圈特殊环境与灾害国家野外科学观测研究站(CRS);瑞士多年冻土监测网络(PERMOS);已发表文献中提取的观测数据;全球历史气候网络(GHCN)中年均气温为 2–10°C 的气象站,用于扩充非多年冻土点位。环境因子数据主要来自以下高分辨率全球数据集:气温与降水量来自 WorldClim 2.1[19], 为减少年际气候波动对结果的干扰,数据均采用9年滑动平均值(即以目标年份为中心,前后各扩展4年)进行平滑处理;海拔采用哥白尼数字高程模型(Copernicus DEM);积雪日数由 MODIS 北半球逐日无云雪覆盖产品统计获得;土壤黏粒含量来自 SoilGrids 2.0[20],原始分辨率 250 m,已重采样至 1 km。
以多年冻土与非多年冻土站点数据为基础,提取其对应的环境因子信息,采共选取包括气温、降水、积雪日数、海拔、经纬度、土壤属性等 20 个环境因子。模型评估阶段选取13种常见机器学习分类算法,通过网格搜索与40次5折交叉验证进行对比,最终确定随机森林模型为最佳方案。基于模型特征重要性排名,结合特征组合测试确定最优特征组合,并以全体站点数据训练构建最终模型。采用分块策略对欧亚大陆进行预测。最终生成2000、2005、2010、2015和2020年五期1 km分辨率的多年冻土分布图,每期对应一个GeoTIFF格式栅格数据文件。
(1)在站点数据整理过程中,严格筛除坐标异常、标签不明或与区域气候条件不符的点位,确保空间分布代表性与分类准确性。各类栅格因子重采样后按统一网格系统对齐,并剔除缺失值区域,保证输入数据完整性与一致性。
(2)随机森林模型表现出良好的稳定性和泛化能力。在采用最优特征组合后,多次5折交叉验证结果显示,其在验证集上的平均准确率为0.936,F1分数为0.936,AUC-ROC与AUC-PR均超过0.93。最终预测模型在全体样本上的评估结果更优。
(3)预测多年冻土分布显示出明显的高纬与高海拔控制特征,与已有多年冻土分布格局吻合。边界区域过渡平滑,空间连续性良好。通过块处理方式有效控制大范围推理过程中的误差传播与内存开销,保障结果的稳定性与实用性。
# | 编号 | 名称 | 类型 |
1 | 2022YFF07117 | 冰冻圈大数据挖掘分析关键技术及应用 | 国家重点研发计划 |
2 | No. CSFSE-TZ-2407 | 冰冻圈科学与冻土工程全国重点实验室自主部署项目 | 其他 |
# | 标题 | 文件大小 |
---|---|---|
1 | _ncdc_meta_.json | 7.2 KiB |
2 | Permafrost Distribution Dataset over Eurasia at 1 km Resolution (PDDE, 2000–2020) |
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596