基于品牌、门店的名称、原子词、类目词等基础特征,确定商户与品牌的挂载关系,在品牌商户的精细化运营场景中,结合商户经营情况,圈选平台头部品牌,针对品牌的经营状况、菜品结构、营业时长等其他条件,给品牌商户输出诊断建议,在同一品牌的不同商户间进行经营策略的复制,辅助平台品牌商户成长。
商家挂载品牌算法大体分为两步:召回与排序打分。对于召回部分:运用自然语言处理的NER命名实体识别算法分别对店铺名以及品牌名识别出原子词和类目词(原子词:即名称中的核心词,能够精准描述店铺和品牌的最短文本,如“全家便利店”的“全家”,“瑞幸咖啡”的“瑞幸”;类目词:即描述店铺或品牌的品类词,如“全家便利店”的“便利店”,“瑞幸咖啡”的“咖啡”);通过原子词和类目词的文本相似度召回店铺的潜在挂载品牌。对于排序打分部分:使用深度学习二分类模型对召回部分的结果进行相似度打分,其中模型输入特征选取文本特征和类目信息特征(对于品牌类目,通过已挂载品牌的商户清洗得到top3类目);然后将特征输入到基于bert+transformer的双塔二分类模型;选取模型阈值大于0.8,且匹配分数最高的品牌作为最终商户与品牌的挂载结果。
| 字段名 | 类型 | 描述 |
|---|---|---|
门店id |
-- | -- |
门店名称 |
-- | -- |
品牌id |
-- | -- |
品牌名称 |
-- | -- |
匹配分 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 门店id | 1149160xxx |
| 门店名称 | 过路人饭团XXXX |
| 品牌id | 868xxx |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/36344