本数据集主要用于提升AI模型对道路扬尘污染情况的识别能力与精确性。通过对该数据集的训练,使AI模型能够结合气象数据智能识别扬尘超标路段,并可应用于环保执法监管、工地扬尘治理、道路保洁调度及空气质量改善等场景。同时,本数据集可为环卫部门优化洒水降尘作业、城市大气污染防治决策提供数据支持,从而全面提升道路扬尘污染治理效率和空气质量改善成效。
1.数据采集 通过企业自有摄像设备(含天气状况模块)自行采集道路图像,同步采集图像ID、采集时间、设备型号、地理坐标、监测点位类型、实时风速、空气湿度、能见度、PM10实时浓度等数据。 2.数据预处理与标注 通过数据清洗剔除设备异常数据。按6:2:2比例划分训练集/验证集/测试集。设置多级标注体系: 一级标签:达标/超标 二级标签:轻度污染/中度污染/重度污染 辅助标注:主导污染因素 3.模型选择与初始化 采用EfficientNet-B4模型架构,初始化参数并优化超参数:学习率0.001-0.0001动态调整,批量大小32,锚框参数动态调整集成注意力机制提升小目标检测能力。 4.模型训练 基于PyTorch框架实施训练,采用混合精度训练(FP16)提升效率。设置训练时长,数据增强模拟不同气象条件下的扬尘特征,添加车辆运动模糊效果,模拟设备镜头污染干扰,设置早停机制(patience=20),梯度裁剪(max_norm=1.0)。 5.模型评估 在训练模型的过程中,使用验证集调整超参数,训练完成后在测试集上评估模型表现,评估指标包含: 基础性能指标:mAP@0.5、误报率 场景鲁棒性测试:大风天气识别率、夜间检测准确率 并设置渐进式测试:单一材料→混合材料,明显堆放→初期堆放
| 字段名 | 类型 | 描述 |
|---|---|---|
图像ID |
-- | -- |
采集时间 |
-- | -- |
设备型号 |
-- | -- |
地理坐标 |
-- | -- |
监测点位类型 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 图像ID | DUST_20240710_1430_001 |
| 采集时间 | 2024-07-10 14:30:22 |
| 设备型号 | Canon EOS R5 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/8412832