该能耗异常检测分析数据在为持续的、大规模的能耗数据监控体系提供一个自动化的“哨兵”功能。该模型可针对业务低活跃期或无人值守时段的能耗脉搏进行监测,定位那些偏离正常模式的异常点。通过多维度算法的融合评判,将原本依赖人工经验的、被动的异常排查,转变为一个主动发现、早期预警的智能化流程。这不仅提升了运营管理的效率和可靠性,更能通过对异常根源的追溯,为优化决策提供数据洞察,从而实现成本的节约与系统稳健性的增强。
1.数据来源:收集公司研发的智慧能源软件产品在浙江地区2023年1日1月到2024年12月31日某园区夜间能耗数据,包括年份、日期、夜间总耗电(kWh)、夜间常用设备总能耗(kWh)、夜间常开设备能耗比例等字段,其中“夜间常开设备能耗比例”=“夜间总耗电”/“夜间常用设备总能耗”;2.算法加工:能耗数据的异常检测分析采用了多算法融合的策略,通过Z分数法计算每个数据点相对于整体分布的标准化偏差(公式:Z = |X-μ|/σ),当Z值超过3倍标准差时标记为异常;运用四分位距法基于数据分布的四分位数(Q1、Q3)和四分位距(IQR=Q3-Q1)设定正常值范围(下限:Q1-1.5×IQR,上限:Q3+1.5×IQR),超出该范围的数据被视为异常;针对能耗比例逻辑设置了多重校验规则,包括比例超过150%、比例为负值、零能耗时比例非零、设备能耗大于总能耗等异常情形;最后采用孤立森林算法(参数包含树数量、采样策略、污染率、特征数、随机种子)进行无监督异常检测,得到孤立森林异常分数;3.最终评估:综合各算法结果通过加权平均(公式:综合异常评分 = (Z分数异常 + 四分位距异常 + 比例逻辑异常 + 孤立森林异常) / 4)生成0-1的异常评分,并依据评分区间划分为三个等级:评分≤0.3为正常,0.3<评分≤0.7为可疑,评分>0.7为异常。
| 字段名 | 类型 | 描述 |
|---|---|---|
年份 |
-- | -- |
日期 |
-- | -- |
夜间总耗电(kWh) |
-- | -- |
夜间常用设备总能耗(kWh) |
-- | -- |
夜间常开设备能耗比例 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 年份 | 2024,2023,2023,2023,2024 |
| 日期 | 03月22日,04月07日,03月13日,05月16日,04月16日 |
| 夜间总耗电(kWh) | 1912,5940,2033.2,4335.2,3141.6 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/8428765