通过采集基础设施服务底层数据,如:1)物理网络设备的运行状态数据;2)IDC机房(包间、机柜)温度、电力、功耗、网络状态、设备运行状态等数据;3)公有云云网络的运行状态、公有云产品运行状态、公有云底层物理机状态数据;4)自建的各种基础设施服务的运行状态、性能指标等数据。基于自定义的算法规则对数据进行清洗、消噪、匹配、分析,实现对底层基础设施底座的异常动态感觉、精确触达和可视化展示,有效的解决用户对云底层ECS异常信息黑盒感知问题及信息孤岛问题。
实时采集来自各个基础设施领域的数据,从海量的数据中提炼出有效的信息进行等级划分和可视化处理,根据原始数据里面定义的事件级别及影响面,将事件转换为可识别的等级。ECS事件处理算法:通过订阅采集阿里云ECS底层异常事件,对事件进行实时消费计算,解析其中关键字段:instanceId、type、appName、eventId、level等,算法字段与数据字段对应关系:level:event_level,instanceId:instance_id,type:item_rule_id,appName:effect_range_source,eventId:event_id,使用type字段和我们现有数据资产配置关注的type值进行对比,进行第一波清洗,命中会进行下一步清洗,通过instanceId、appName字段和现有数据资产结合,进行insanceId,appName字段关联的子父级资产摸排,利用所有的子父级资产和我们关注的数据比对,命中则打标入库进行下一波消费。然后通过令牌桶算法,设定桶的大小,对数据进行聚合消噪,根据业务订阅规则触达至业务方,推送全局观测大屏进行展示。
| 字段名 | 类型 | 描述 |
|---|---|---|
__time__ |
-- | -- |
data_source |
-- | -- |
effect_range_message |
-- | -- |
effect_range_source |
-- | -- |
event_id |
-- | -- |
| fieldName | exampleValue |
|---|---|
| __time__ | 2023/11/14 15:31:57 |
| data_source | aliyun |
| effect_range_message | kbtdatadistribute |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/30448