根据企业用户的历史用水数据,构建企业用户的用水习惯画像,判断该用户在某段时间内是否有异常用水(过多、过少)情况,并发出预警;为企业提供用水优化建议;从用水视角评估企业经营健康状况,为后续合作提供决策依据。
数据采集:客户信息在用户办理水务业务时录入系统自动生成并存储,表务类数据由智能水表与数据采集系统实时采集传输至营收系统或通过抄表人员人工抄表的方式获取。 数据处理: 1、数据采集自企业内部,对数据进行清洗,去除异常值、消除重复数据,确保数据的准确性。 2、算法公式: 方法 1:四分位距法(IQR)—— 抗极端值干扰 该方法通过剔除历史数据中的极端值(如偶然的设备维修、短期停水),计算出 “正常波动区间”,适合用水数据有少量异常值的情况。 计算步骤(以月度数据为例): 收集数据:将过去12个月的用水量整理在Excel列中(如 A1:A12,代表 12个月数据)。 计算四分位数: 下四分位数(Q1):第25百分位的数值,公式:=QUARTILE.EXC(A1:A12, 1) 上四分位数(Q3):第75百分位的数值,公式:=QUARTILE.EXC(A1:A12, 3) 计算四分位距(IQR):IQR=Q3-Q1 确定正常波动范围: 下限:Q1-1.5*IQR(若结果为负,取0,因用水量不能为负)【=IF(Q1-1.5*IQR<0,0,Q1-1.5*IQR)】 上限:Q3+1.5*IQR 设定阈值:将“上限与历史均值的比值”和“下限与历史均值的比值”作为波动阈值(百分比)。 历史均值:=AVERAGE(A1:A12) 上限阈值(增长):(上限-均值)/均值*100% 下限阈值(下降):(下限-均值)/均值*100% 判定用水量是否异常:对比当期用水量与上下限阈值,超过上限阈值或低于下限阈值则判定为异常,否则正常。【=IF(当期用水量>上限值,"异常(超上限"&TEXT((当期用水量-均值)/均值,"0%")&")",IF(当期用水量<下限值,"异常(低于下限"&TEXT((当期用水量-均值)/均值,"0%")&")","正常(在合理范围)")】 示例:某企业 12 个月用水量均值为 500 吨,Q1=450,Q3=550,IQR=100。则上限 = 550+150=700,下限 = 450-150=300。上限阈值 =(700-500)/500=40%,下限阈值 =(300-500)/500=-40%。即当月用水量超过 700 吨(增 40%)或低于 300 吨(降 40%)时,判定为异常。
| 字段名 | 类型 | 描述 |
|---|---|---|
唯一编码(水表) |
-- | -- |
事务类型 |
-- | -- |
经度 |
-- | -- |
纬度 |
-- | -- |
行政区域 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 唯一编码(水表) | 11***927,11***304,11***751,11***068,11** |
| 事务类型 | 企业,企业,企业,企业,企业 |
| 经度 | 120.***013,120.***419,120.***738,120. |