近年来,细颗粒物(PM2.5)和环境臭氧(O3)的健康风险已得到广泛认可。对 PM2.5 和 O3 暴露的准确估计对于支持健康风险分析和环境政策制定非常重要。本数据集研究旨在构建高性能的随机森林模型,以 1 km × 1 km 的空间分辨率估算 2005-2017 年中国PM2.5 日平均浓度和臭氧日最大 8 h 平均浓度(O3-8 hmax)。模型变量包括气象变量、卫星数据、化学传输模型输出、地理变量和社会经济变量。建立了基于 10 倍交叉验证的随机森林模型,并进行了时空验证以评估模型性能。根据我们基于样本的划分方法,测试数据集的 PM2.5 日、月和年估计值的平均模型拟合 R2 值分别为 0.85、0.88 和 0.90;O3-8 hmax 的R2 值分别为 0.77、0.77 和 0.69。气象变量及其滞后值会显著影响 PM2.5 和 O3-8 hmax 的估计值。2005-2017 年期间,PM2.5 浓度总体呈下降趋势,而环境 O3 浓度则呈上升趋势。2005 年至 2017 年期间,PM2.5 和 O3-8 hmax 的空间模式几乎没有变化,但时间趋势具有空间特征。
| 采集时间 | 2005/01/01 - 2017/12/31 |
|---|---|
| 采集地点 | 中国 |
| 数据量 | 1004.2 MiB |
| 数据格式 | csv |
| 坐标系 | WGS84 |
本研究使用的模型变量主要包括用于 PM2.5 建模的 Aqua AOD、用于 O3 建模的 GEOS-Chem 化学传输模型输出以及 PM2.5 和 O3共享的一些变量。PM2.5 和 O3 共享的变量:13 个气象变量(包括边界层高度、表面气压、2 米露点温度、蒸发、反照率、低云量、中云量、高云量、总降水量、10 米 U 型分量、10 米 V 型分量、 此外还有地理和社会经济变量,如数字高程模型(DEM)、归一化差异植被指数(NDVI)、人口、国内生产总值(GDP)、公路网和虚拟变量(包括季节、月份和省份)。简而言之,大多数模型变量都是在 ArcGIS 10.2 和Python 2.7 中使用插值方法(如反距离加权和双线性算法)将其处理为基于标准网格的 1 km × 1 km 分辨率。AOD 由 ENVI 5.3+IDL 处理,使用 ArcPy 提取到标准网格,然后进行反距离加权插值,得到 1 km×1 km 分辨率的数据。对于长期变量,每天分配相应的月度和年度水平值。
本研究的模型变量包括 2013-2017 年的气象变量、地理变量、社会经济变量、卫星数据和化学传输模型输出。获得了 2013-2017 年 1479 个站点的 PM2.5 日均浓度和 O3 日最大8 小时平均浓度(O3-8 hmax)监测数据。在全国(35.55°N 至43.12°N,112.95°E 至 120.35°E)建立了 1 km × 1 km 的标准网格,共 9495025 个网格单元。网格坐标系为 WGS-84,网格投影为阿尔伯斯投影。我们构建了高性能随机森林模型(时间分辨率:日;空间分辨率:1 km × 1 km),并估算了 2005-2017 年中国的网格日均PM2.5 浓度和 O3-8 hmax 浓度。
交叉验证结果表明,估算的 PM2.5 和 O3-8 hmax 浓度与观测到的 PM2.5 和 O3-8 hmax 浓度匹配合理,拟合检验-R2 值较高。根据基于样本的划分方法,PM2.5 日、月和年估计浓度的检验-R2 值分别为 0.85、0.88 和 0.90 同样,估算的每日、每月和每年 O3-8 hmax 浓度的检验-R3 值分别为 0.77、0.77 和 0.69。PM2.5 的日均均方根误差和最大均方根误差分别为 17.72μg/m3 和 9.37μg/m3;O3-8 hmax 的日均均方根误差和最大均方根误差分别 为 23.10μg/m3 和 15.43μg/m3。在省/市层面,上海、北京、湖北、河北和四川的 PM2.5 估算结果以相对较高的检验 R2(≥ 0.90)排名前五,而西藏、青海、甘肃、安徽和云南的PM2.5 估算结果则以相对较低的检验 R2 值(< 0.70)排名较后。北京、重庆、上海、天津和河南的 O3-8 hmax 估测结果的检验 R2 值相对较高(≥ 0.83),排名前五;而甘肃、安徽、黑龙江、贵州和西藏的 O3-8 hmax 估测结果的检验 R2 值相对较低(< 0.62),排名较差。
本作品采用
知识共享署名
4.0 国际许可协议进行许可。
| # | 标题 | 文件大小 |
|---|---|---|
| 1 | 2005_pm.rar | 33.9 MiB |
| 2 | 2006_pm.rar | 33.9 MiB |
| 3 | 2007_pm.rar | 34.0 MiB |
| 4 | 2008_pm.rar | 34.1 MiB |
| 5 | 2009_pm.rar | 33.9 MiB |
| 6 | 2010_pm.rar | 33.8 MiB |
| 7 | 2011_pm.rar | 33.9 MiB |
| 8 | 2012_pm.rar | 34.0 MiB |
| 9 | 2013_pm.rar | 34.0 MiB |
| 10 | 2014_pm.rar | 33.8 MiB |
| # | 时间 | 姓名 | 用途 |
|---|---|---|---|
| 1 | 2026/01/17 07:28 | 袁*静 |
Paper title:生命历程中长期暴露于PM2.5与臭氧对中国中老年认知功能的影响:基于中国队列与英国生物银行的多组学机制探索
Paper abstract:本研究旨在系统探究生命历程中长期暴露于多种空气污染物(PM2.5与O3)对中国中老年人群认知功能下降及脑结构改变的影响,并利用英国生物银行(UK Biobank, UKB)数据进行跨人群、跨地域的外部验证,以增强研究结论的普适性。
本数据集是完成此研究不可或缺的关键数据来源,原因如下:(1)研究设计需求:认知衰退是长期、累积性过程。本研究需追溯研究对象在过去十余年(特别是中年关键期)的长期暴露历史。贵数据集覆盖2005-2017年的长时序、日分辨率数据,完美契合构建个体“暴露史”的需求,能计算年均、累积暴露量,并识别关键暴露窗口期。(2)多污染物联合评估:近年研究提示,O3作为强氧化性污染物,其神经毒性可能独立于PM2.5。贵数据集同时提供PM2.5与O3-8hmax的高精度估算,使首次在中国人群中进行两种主要污染物的独立与协同效应分析成为可能,对于全面评估空气污染的健康负担至关重要。(3)暴露评估精度:研究神经系统这类敏感的健康终点,需要极高精度的暴露评估以减少错分偏倚。贵数据集基于多源数据与随机森林模型,在1公里空间分辨率上实现了较高的验证精度(PM2.5年估计R²=0.90;O3月/日估计R²=0.77),能极大提升个体暴露水平估计的准确性,特别是在城乡结合部等暴露梯度明显的区域。(4)跨队列验证的可行性:研究计划利用UKB数据进行外部验证。贵数据集的时空范围(2005-2017)与UKB部分参与者在中国居住的时间段有重叠可能,为在具有详细认知测评、脑影像及遗传/表观遗传数据的国际大型队列中验证暴露-反应关系提供了宝贵机会,有助于确认生物学机制的普适性。
综上,贵数据集的长时序、高精度、双污染物覆盖特点,是支撑本项关于空气污染与认知老化机制研究的理想且不可替代的数据基础。
Paper type:期刊论文
Tutor:曾平教授
|
| 2 | 2025/11/27 01:17 | 单* |
用于京津冀大气PM2.5重构数据图像绘制算法编写
|
| 3 | 2025/04/11 01:09 | 成* |
公益数据申请使用,星图地球j今日影像产品公开展示
|
| 4 | 2025/04/06 07:56 | 黄*杰 |
Paper title:台风臭氧影响机制研究
Paper abstract:
Paper type:
Tutor
|
| 5 | 2025/10/11 01:15 | 潮*濛 |
论文题目:内蒙古植被覆盖变化及驱动因素分析
数据在研究中的作用:分析气象因子对植被覆盖的驱动作用及植被覆盖变化对PM2.5的影响
论文类型:硕士论文
导师姓名:潮洛濛
|
| 6 | 2024/05/21 03:38 | 朱*良 |
Paper title:基于深度学习的中国连续空间覆盖PM2.5浓度预报
Paper abstract:PM2.5作为研究的样本数据和精度检验数据
Paper type:期刊论文
Tutor:王翔
|
| 7 | 2024/03/13 00:42 | 王* |
全球荒漠化风险数据集(2001-2018 年)
中国内陆地表水(ISWDC) 数据集(2000-2016年)
基于多变量随机森林模型的中国1公里日环境PM2.5和O3浓度全覆盖数据集(2005-2017 年)
全球初级生产总值长期变化的改进估计数据集(1982-2017年)
中国月地面太阳辐射数据集(2000-2017年)
|
| 8 | 2023/11/24 04:41 | 徐* |
查看是否是我论文所需要的数据集,如果能够使用,一定会鸣谢
|
| 9 | 2023/10/13 23:51 | 王*葳 |
生态学在读研究生进行学习和研究,想要进一步了解中国近些年的臭氧动态
|
| 10 | 2023/10/11 07:14 | Zh*****Zhu |
我们的研究项目考察交通对环境污染的影响,因此需要用到此处的数据。
|
| # | 类别 | 标题 | 作者 | 年份 |
|---|---|---|---|---|
| 1 | 论文 | Full-coverage 1\,km daily ambient PM$_{2.5 | R,Ma,J,Ban,Q,Wang,Y,Zhang,Y,Yang,S,Li,W,Shi,Z,Zhou,J,Zang,T,Li | 2022 |
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596

