近年来,受计算机视觉与自然语言处理领域成功启发,数据驱动的深度学习方法展现出克服这些挑战的巨大潜力。然而,缺乏大规模多样化的基准数据集仍是此类方法开发与评估的主要障碍。为填补这一空白,我们推出OpenSWI综合基准数据集,该数据集通过表面波反演数据集预处理(SWIDP)管道生成。OpenSWI包含两套针对不同研究尺度与应用场景的合成数据集——OpenSWI-shallow与OpenSWI-deep,以及用于泛化评估的人工智能就绪型真实数据集OpenSWI-real。OpenSWI-real整合自开源项目,包含两组观测色散曲线及其对应的一维参考模型,作为评估深度学习模型泛化能力的基准数据集。
| 采集时间 | 2013/01/01 - 2016/12/31 |
|---|---|
| 采集地点 | 全球 |
| 数据量 | 38.5 GiB |
| 数据格式 | .npz |
| 数据时间分辨率 | 年 |
| 坐标系 |
OpenSWI-shallow源自二维地质模型数据集OpenFWI,包含逾2200万组一维速度剖面及其基本模式相位与群速度色散曲线,覆盖广泛的浅层地质结构(如平坦层、断层、褶皱及真实地层)。OpenSWI-deep由14个全球及区域性三维地质模型构建而成,包含约126万组高精度一维速度-色散数据对,专用于深部地球研究。
通过表面波反演数据集预处理(SWIDP)管道生成。
为验证OpenSWI实用性,我们基于OpenSWI-shallow和OpenSWI-deep训练深度学习模型,并通过OpenSWI-real进行评估,结果显示预测模型与基准速度模型高度吻合,证实了OpenSWI数据集的多样性与代表性。
本作品采用
知识共享署名
4.0 国际许可协议进行许可。
| # | 标题 | 文件大小 |
|---|---|---|
| 1 | OpenSWI:用于表面波色散曲线反演的大规模基准数据集(2013,2016年).zip | 38.5 GiB |
| 2 | _ncdc_meta_.json | 4.5 KiB |
| # | 类别 | 标题 | 作者 | 年份 |
|---|---|---|---|---|
| 1 | 论文 | OpenSWI: A Massive-Scale Benchmark Dataset for Surface Wave Dispersion Curve Inversion | F,Liu,S,Zhao,X,Gu,F,Ling,P,Zhuang,Y,Li,R,Su,L,Fang,L,Zhou,J,Huang,L,Bai | 2025-11-05 |
© 中国科学院西北生态环境资源研究院 2005- 备案号:陇ICP备2021001824号-21
兰州市东岗西路320号, 730000, 电话: 0931-4967592,0931-4967596

