本数据集包括全球水库清单(GREI_v1)和全球水库泥沙淤积数据库(GREI_Sed_v1)。GREI_v1记录全球555,960座面积大于0.001 km²水库的空间位置、边界及属性信息,包括水库名称、面积、位置、库容、平均水深等,总面积为469,639.9 km²,其中85,843座水库具有核验库容信息,总库容为6,851.7 km³;GREI_Sed_v1在该清单基础上,利用6,133个实测泥沙淤积样本和机器学习模型估算全球水库年淤积率与库容损失。该数据集弥补了现有全球水库数据库对小型水库和新建水库覆盖不足的缺陷,可服务于水资源管理、水文学、泥沙输移、气候适应与可持续发展研究。
数据详细信息参见:Liu, K., Fan, C., Song, C. et al. Global patterns of reservoir sedimentation and overlooked risks in small reservoirs. Nat Sustain (2026). https://doi.org/10.1038/s41893-026-01859-y
| 采集时间 | 1930/01/01 - 2021/12/31 |
|---|---|
| 采集地点 | 全球 |
| 数据量 | 296.6 MiB |
| 数据格式 | *.tif |
| 数据空间分辨率(/米) | 30m |
| 数据时间分辨率 | 年 |
| 坐标系 | WGS84 |
数据包主要包括:GREI_v1.gdb(全球水库空间清单及属性)、GREI_Sed_v1.gdb(全球水库泥沙淤积估算及相关属性)、Sedimentation_sample_sources.xlsx(6,133个实测淤积样本来源)、GREI_data_sources.xlsx(数据源汇总)和GREI_data_dictionary.xlsx(变量、数据类型、单位与属性定义)。水库位置来源包括GRanD、FHReD、GOODD、GeoDAR、GREI-p2k、Geo-referenced Database on Dams等全球数据库,16个国家/区域尺度数据集(包括中国、美国、印度等),以及OpenStreetMap。水库边界主要基于Global Surface Water(GSW)和GLAD长期水体发生数据(30 m Landsat,1984–2020),小型水库(<0.01 km²)进一步使用10 m Sentinel-2水频率数据(2019–2021)补充。泥沙淤积样本来源于中国全国水库淤积调查、美国Reservoir Sedimentation Survey Information System-II、印度Central Water Commission资料,以及Web of Science文献检索获取的100余篇相关研究。
数据生产主要包括以下步骤:(1)整合并标准化多源水库位置数据,对全球公共数据库、国家/区域数据集和OSM数据进行清洗、地理配准、人工检查和高分辨率卫星影像交叉验证,并剔除110个受调控天然湖泊;(2)基于GSW和GLAD水体发生数据提取1984–2020年历史最大淹没范围,对小型水库使用2019–2021年Sentinel-2 10 m水频率数据精细化边界,并对狭长河谷型水库结合更高分辨率影像和人工判读修正;(3)开展拓扑校正和空间一致性检查,形成全球水库边界数据库;(4)汇集库容和名称等属性信息,对缺失库容通过平均水深机器学习模型估算(库容=平均水深×面积);(5)对实测淤积样本进行质量控制,剔除1930年前调查记录和调查间隔短于5年的记录,进行空间匹配并对重复记录保留调查间隔最长者;(6)构建水库平均水深和年淤积率预测模型,使用气候、地貌、土壤、水文、土地覆盖、人类活动和水库形态等变量,并分别在水库区、1 km邻域区和上游汇水区提取统计量;(7)比较CNN、SVM、XGBoost及多种树模型,采用70%训练/30%测试、五折交叉验证和网格搜索优化,最终选择XGBoost模型。
数据质量控制贯穿位置整合、边界提取、属性汇编和模型估算全过程。水库位置记录经过系统清洗、人工检查和高分辨率影像交叉验证,以去除错误或错位水库;边界提取后开展拓扑校正和空间一致性检查。最终数据集包含555,960座全球水库,总面积469,639.9 km²。库容数据方面,85,843座水库具有核验库容信息,合计6,851.7 km³,代表全球净库容的90.4%。泥沙样本方面,原始调查资料经过调查年代、调查间隔、空间匹配和重复记录筛选后,最终保留6,133个与水库多边形匹配的实测淤积记录;样本覆盖近60个国家,水库面积范围为0.001–5060 km²,年淤积率5–95分位范围为0.29%–1.65%。模型质量采用MAE、RMSE和一倍标准差误差评估,并通过五折交叉验证、测试集评估、变量重要性和训练样本策略分析验证模型稳健性与空间可迁移性。
| # | 编号 | 名称 | 类型 |
| 1 | 2022YFF0711603 | 地球表层系统关键参数自动生成与挖掘分析 | 国家重点研发计划 |
| 2 | 42371399 | 基于遥感虚拟星座的青藏高原内流河水文变化监测 | 国家自然科学基金 |
| 3 | 42571492 | 可可西里盐湖漫溢对长江北源水系结构与径流演变的影响研究 | 国家自然科学基金 |
| 4 | 42501466 | 长江流域山区小型水库响应洪旱特征的遥感时序监测 | 国家自然科学基金 |
本作品采用
CC BY 4.0 (知识共享 署名 4.0 国际许可协议)进行许可。
| # | 标题 | 文件大小 |
|---|---|---|
| 1 | 全球水库空间清单与泥沙淤积数据集(GREI_v1与GREI_Sed_v1).zip | 296.6 MiB |
| # | 类别 | 标题 | 作者 | 年份 |
|---|---|---|---|---|
| 1 | 论文 | Global patterns of reservoir sedimentation and overlooked risks in small reservoirs | Liu, K.#, Fan, C.#, Song, C.* | 2026 |
_hSgkQ
7Ff1lsoj
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596

