本数据对于地图上POI零件进行匹配分析,帮助预测多个商户是否是现实世界的同一物理门店。
POI零件匹配由信息处理、门店召回、模型预测三部分组成。1、商户信息规范化处理:对于商户POI的信息特征进行规范化处理,包括大小写转化、繁体简体转化、别名转化等,以保证门店信息格式一致;2、相似门店集召回:召回名称、经纬度相似的门店作为算法候选集合;3、模型预测:将名称(b_name、q_name)、地址(b_address、q_address)、经纬度(b_lng、b_lat、q_lng、q_lat)特征输入到BERT模型中得出相似门店的距离(dist),BERT模型会根据以上特征及距离进行综合打分(score),若分数大于0.5,则认为是现实世界的同一物理门店。
| 字段名 | 类型 | 描述 |
|---|---|---|
b_name |
-- | -- |
b_address |
-- | -- |
b_lng |
-- | -- |
b_lat |
-- | -- |
b_city |
-- | -- |
| fieldName | exampleValue |
|---|---|
| b_name | 沂蒙*****·炒鸡米饭 |
| b_address | 崮云*****处丹凤小区商业街西1-2-3-3 |
| b_lng | 116.779352 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/33857