中信数科 DataTrust 数据市场

数据集浙江盘石信息技术股份有限公司

互联网挖掘异常值分析数据

价格待定

数据描述

采集海量互联网数据，分析挖掘数据异常值，精准识别数据异常值，为后期海量脏数据处理清洗转换作基础，是最终实现覆盖大面积有效网络相关数据的支撑。

算法/方法论

1.数据来源采集了包括全网精品综合门户网站、全品类优质行业网站、权威地方官媒网络、移动端APP媒体，涵盖全部115个细分行业互联网数据，覆盖95%的中国网民、40万家优质合作网站。 2.数据处理对采集到的数据进行异常值分析，采用Z-score的方法计算异常值，公式为： Z = (x - μ) / σ其中，x是usetype单个数据值，μ是数据集中枢，σ是数据标准差。其中， μ = sum(data) / len(data)； σ = sqrt((sum((x - μ)^2) / len(data)) data数据集为每行domain中的数据累计计分，计分维度包括id、state、usetype、ip、pv、area_id、siteid、sitename、domain、login、respond等; 根据互联网不同应用场景给定异常值范围，例如-3<Z<3，实现数据异常值的精准识别。 3.数据应用通过对互联网数据进行分析挖掘，有效识别数据异常值，是后期海量脏数据处理清洗转换的基础，是最终实现覆盖大面积有效网络相关数据的支撑。

字段定义

字段名	类型	描述
`id`	--	--
`state`	--	--
`usetype/x`	--	--
`ip`	--	--
`pv`	--	--

样本数据

fieldName	exampleValue
id	1
state	4
usetype/x	16

调用API获取完整数据

基本信息

数据格式: --
数据类型: --
记录数量: 3281
所属行业: 信息传输、软件和信息技术服务业
登记企业: 浙江盘石信息技术股份有限公司

V6 评分明细

描述质量 0.0 / 20

结构规范 0.0 / 20

规模时效 0.0 / 15

安全合规 0.0 / 20

认证标注 0.0 / 15

商业价值 0.0 / 10

API 调用示例

curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/9366

获取API密钥已有账户？登录

认证信息

证书编号: 20231033000002165
登记编号: SZ2023120002165.2