面向AI-Ready的路面状态标准化图像数据集（2023-2024年）

中文名称

英文名称

road surface conditions dataset（2023-2024）

CSTR

CSTR:11738.11.NCDC.DPRSC.DB6686.2024

DOI

10.12072/ncdc.dprsc.db6686.2024

数据共享方式

在线下载

数据分类

其他

来源站点

平台服务中心

数据贡献者

刘景琦

数据集摘要

鉴于国际上公开的标准化道路表面气象条件数据集极为稀缺，尤其在极端天气条件下的路面状况图像资源更为不足，本研究构建了一套冰雪灾害路面状况数据集，填补了这一领域的空白，为提升路面状况识别模型的性能和准确性提供了宝贵的基础资源。

该数据集聚焦冰雪灾害条件下的路面状况，基于极端天气对交通管控影响的统计分析，将路面冰雪灾害主要划分为路面结冰、风吹雪和强降雪三种类型。数据来源包括公路摄像头、移动设备及网络资源，最终构建了涵盖六种典型路面类型的数据集：干燥路面、积雪路面、结冰路面、吹雪路面、融雪路面及湿滑路面。

在数据处理阶段，为避免因数据增强操作引入的潜在相关性，进而影响模型性能评估的准确性与可靠性，本研究采取了相对谨慎的策略。首先，将原始数据集划分为训练集、验证集及测试集，确保各子集直接的独立性，随后针对每一个子集分别执行数据增强操作，尽可能减小子集间因增强步骤先后而产生的数据交叉影响。经过多种增强策略（如翻转、旋转、平移和高斯噪声添加）处理，数据集规模最终达到9000张。

为进一步提升深度学习模型训练的效率和收敛速度，在相关模型进行训练时，应对数据集进行归一化处理，通常采用零均值和单位标准差的标准化方法。这里提供该数据集的均值及标准差值。该数据集在红、绿、蓝通道上的均值分别为[0.550, 0.565, 0.568]，标准差分别为[0.082, 0.082, 0.085]。

基本信息

采集时间	2023/10/01 - 2024/10/01
采集地点	公路摄像头、移动设备及网络资源
数据量	215.8 KiB
数据格式	.jpg
坐标系

数据源描述

数据来源包括公路摄像头、移动设备及网络资源等

数据加工方法

• 图像缩放：将图像调整为224×224像素，这是深度学习中常用的标准尺寸，能够在计算效率和模型性能之间实现良好的平衡。该尺寸广泛应用于基于ImageNet预训练的模型（如VGG和ResNet），并在实际应用中证明了其有效性。

• 数据集划分：将数据集随机划分为训练集、验证集和测试集，比例分别为60%、20%和20%。

• 亮度调整：由于路面状况复杂多变，容易出现物体遮挡和光照不均等问题，导致图像中可能存在过亮或过暗的区域，从而掩盖或模糊关键细节。此外，这些因素可能导致不同类型的路面在外观上变得相似，增加识别难度。为了解决这些问题，采用了一种基于二维伽马函数的自适应校正算法对图像的光照强度进行调整。

• 数据增强：数据增强是解决数据集不平衡问题的重要步骤，尤其在某些类别的样本数量显著少于其他类别时。通过对现有样本进行翻转、旋转、裁剪、缩放和颜色调整等变换，生成额外的样本。本研究采用OpenCV和NumPy库进行数据增强，通过随机翻转、随机平移、随机旋转以及添加高斯噪声等方式，将图像数量增加到9000张。

• 数据归一化：在相关模型进行训练时，像素值应被归一化为零均值和单位标准差，以加速模型的收敛过程。该数据集在红、绿、蓝通道上的均值分别为[0.550, 0.565, 0.568]，标准差分别为[0.082, 0.082, 0.085]。

数据质量描述

在对数据集进行划分（训练集、验证集和测试集）之前进行数据增强，可能会在这些子集中引入潜在相关性，从而削弱验证集和测试集的独立性，影响模型性能评估的准确性和可靠性。为了解决这一问题，本研究先将数据集划分为三个独立的子集，然后对每个子集分别进行数据增强，尽可能减小子集间因增强步骤先后而产生的数据交叉影响。

项目支持信息

#	编号	名称	类型
1	ZKXFWCG2022060004	新疆交投2021年揭榜挂帅制科技项目	其他
2	2022-ZD-006	2022年度新疆交通运输行业科技项目	其他
3	2022YFF0711704	国家重点研发计划冰冻圈大数据挖掘分析关键技术及应用	国家重点研发计划
4	KY2022041101	新疆交通设计院公司科研基金	其他

引用和标注

为保障平台科技资源的权益、扩展平台中心的服务、提升科技资源的应用潜力，请资源使用者在使用资源所产生的研究成果中（包括公开发表的论文、论著、数据产品和未公开发表的研究报告、数据产品等成果），请按以下方式规范标注和引用。

中文发表的成果中参考以下规范注明：数据来源于国家冰川冻土沙漠科学数据中心 (http://www.ncdc.ac.cn)。

英文发表的成果中参考以下规范注明： The dataset is provided by National Cryosphere Desert Data Center. (http://www.ncdc.ac.cn).

数据引用

刘景琦. 面向AI-Ready的路面状态标准化图像数据集（2023-2024年）. 国家冰川冻土沙漠科学数据中心(http://www.ncdc.ac.cn), 2024. https://cstr.cn/CSTR:11738.11.NCDC.DPRSC.DB6686.2024.
刘景琦. 面向AI-Ready的路面状态标准化图像数据集（2023-2024年）. 国家冰川冻土沙漠科学数据中心(http://www.ncdc.ac.cn), 2024. https://www.doi.org/10.12072/ncdc.dprsc.db6686.2024.

Endnote中 Bibtex中 RIS中 GBT7714中 EndnoteEN BibtexEN RISEN

文章引用

Liu J, Zhang Y, Wang Z, Zhang Z. Automated Recognition of Snow-Covered and Icy Road Surfaces Based on T-Net of Mount Tianshan[J]. Remote Sensing, 2024, 16:3727.

引用格式： Endnote Bibtex RIS

许可协议

本作品采用知识共享署名 4.0 国际许可协议进行许可。

#	数据集标题
1	面向AI-Ready的黄土高原坝地标准化语义分割数据集
2	冰川湖图像数据集
3	纳入雪动态的标准化水分异常指数（SZIsnow）全球数据集（1948-2010年）
4	藏东南雅弄冰川末端冰裂隙分布数据集（2022-2023年）
5	全球考虑积融雪过程的标准化水分距平指数数据集（1948-2010年）
6	高分辨率冰川轮廓卫星图像数据集
7	青藏高原高寒荒漠植物图像数据集（2017-2021年）
8	使用深度学习方法自动生成病人特异性放疗剂量分布可行性研究
9	塔里木-准噶尔盆地荒漠植物图像数据集（2017-2021年）
10	阿拉善高原-河西走廊荒漠植物图像数据集（2017-2021年）

#	标题	文件大小
1	_ncdc_meta_.json	7.6 KiB
2	面向AI-Ready的路面状态标准化图像数据集

最近10条服务记录如下
#	时间	姓名	用途
1	2025/07/31 19:48	ZH****ian	为开展交通基础设施冰雪灾害识别研究，亟需贵数据集（涵盖干湿/冰雪路面状态）构建样本库与开发算法，特此申请使用许可。
2	2025/07/26 19:51	陈*豪	我们目前正在进行一项关于道路路况检测项目。为了推进我们的研究/开发工作，我们亟需高质量的道路相关数据集用于模型的训练、验证与测试。
3	2025/04/14 19:18	匿名 [127.0.0.* ]	[开放下载]
4	2025/04/01 16:48	suns********shine	目前正在进行机器学习，需要用到相关数据集，希望获得
5	2025/03/20 04:27	杨*萍	Paper title： Paper abstract： Paper type： Tutor
6	2025/02/13 23:38	李*春	论文题目：基于图像识别的路面附着系数估计数据在研究中的作用：用以分类网络的训练集论文类型：硕士论文导师姓名：马超
7	2025/02/10 00:22	孙*星	为了支持我的毕业论文具有图像的路面积雪结冰检测的研究工作，我需要您提供以下实验或调查数据。
8	2025/01/17 01:52	吴*	用于个人项目数据集测试，以及训练样本所用。
9	2025/01/13 01:14	周*桥	用于路面状态研究，主要关注于路面病害问题
10	2025/01/10 05:27	Bo*****Yan	论文题目：数据在研究中的作用：论文类型：本科生毕业设计导师姓名：王秋才

添加评论

扫码后在手机端浏览

如何获取数据

下载

出版物

东:

西:

南:

北:

导出元数据

数据服务信息

联系人：: 李红星
服务电话：: 0931-4967592
服务邮箱：: ncdc@lzb.ac.cn

联系信息

数据贡献者：: 刘景琦
元数据作者：: 刘景琦
数据管理者：: 李红星