采集杭州市滨江区范围内工资信息线下通过设备和手动录入的方式采集数据到数据库作为原始数据源。最后通过BI工具,按区域工种进行分类统计,利用折线图体现每个地区工种的工资风险走势情况。推送给班组长、企业、劳务公司、监管部门。
(1)数据采集:采集杭州市滨江区范围内工资信息线下通过设备和手动录入的方式采集数据到数据库作为原始数据源。(2)数据处理:首先对采集的工资确认数据进行清洗,包括工资金额为0的或者为null的。然后对数据在时间维度按日,项目维度按企业,区域维度按区域,进行最细级别粒度的聚合。计算得到各工地的工资确认总数量为X,未确认工资人数/X=未确认人数在总工资发放中的占比, 待处理数为已经采集且并未介入处理数, 已处理数为已经开始处理的数量,已完成数为已经确认工资发放的数量,超时未处理数为超时未处理数指超过1天未处理数,X=待处理数+已处理数+已完成数。(3)数据分析: 低危风险数=企业待处理数低于总比10%且超时未处理数低于5%,中危风险数=企业待处理数低于总比20%且超时未处理数低于10%,高危风险数=企业待处理数低于总比30%且超时未处理数低于15%。
| 字段名 | 类型 | 描述 |
|---|---|---|
项目名称 |
-- | -- |
项目地址 |
-- | -- |
工资所属年月 |
-- | -- |
工资确认总数量 |
-- | -- |
未确认工资人数 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 项目名称 | 浙江****有限公司*** |
| 项目地址 | 浙江省杭州市滨江区******************** |
| 工资所属年月 | 2022/2/1 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/11799