该数据的适用条件包括平台拥有大规模的商品信息和用户数据,并且能够追踪和记录用户的详尽历史交互信息。数据的范围主要涵盖了商品数据库、用户个人信息以及详尽的用户交互行为数据。主要应用对象为电商平台的用户群体和平台运营方。 通过算法模型对用户交互行为的分析,能够准确地锁定目标用户,提高召回效率,减少客户流失,从而实现商业价值的最大化。
商品侧:itemId 作为id特征进行embedding操作,item_name、item_desc做文本的嵌入表征,price做分桶操作后得到离散特征同时也做embedding操作,category作为类别特征做embedding操作;用户侧:userId作为id特征进行embedding操作,用户的性别和省份作为类别特征做embedding操作,用户的年龄需要分桶后做为离散特征和分桶操作,此外用户的各种行为序列包括(view_history、click_history、collect_history、buy_history)都会做embeddding操作,在这些特征处理的基础上使用MMOE模型,训练模型后使用模型推断,加权输出获得线上排序得分。 在获得基础排序得分的基础上还需要进行多样性打散和流量调控等操作。对于多样性打散而言,主要是对获取的商品向量表征,基于DPP多样性模型进行排序的重调整;对于流量调控而言,主要是对获取实施的商品曝光、点击等数据进行基于流量目标的调整,使用强化学习Q-Learning 以及 PID控制技术进行流量调控,确保不同类型商品的曝光量符合整体策略。
| 字段名 | 类型 | 描述 |
|---|---|---|
商品信息 |
-- | -- |
用户信息 |
-- | -- |
用户历史交互 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 商品信息 | {itemId:123, item_name:手机, item_desc:智能手 |
| 用户信息 | {userId:001, age:25, gender:男, province: |
| 用户历史交互 | {userId:001, view_history:[123,334,554], |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/30899