在互联网实务中,各类平台中的风险账号通常是由机器随机生成并批量注册,由此,这些风险账号所包含的字符串中的字符排列较为混乱;而对用户账号的混乱度进行量化处理并得到混乱度,有助于快速初步判断该用户账号是否为风险账号。
1.对用户账号集合中的用户账号字符串进行统计、分析,构建字符串表; 2.对目标用户账号进行切分处理得到若干个目标字符串; 3.将上述若干个目标字符串与字符串表进行匹配,得出能匹配到上述字符串表中的字符串数量和各个字符串的长度; 4.基于匹配到的字符串数量和各个字符串的长度计算平均长度; 5.取平均长度的倒数作为目标用户账号的混乱度。
| 字段名 | 类型 | 描述 |
|---|---|---|
字符串表 |
-- | -- |
目标用户账号 |
-- | -- |
目标字符串 |
-- | -- |
匹配到的字符串数量 |
-- | -- |
匹配到的字符串长度 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 字符串表 | wan,wang,wu,wo……; yu,you,yan,ya……; wuyu, |
| 目标用户账号 | wuyou.wang_1990 |
| 目标字符串 | wu,you,wang,1990,wuyou |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/22256