返回数据集列表
数据集 杭州网易再顾科技有限公司

电商推进场景下的召回数据

价格待定
数据描述

该数据的适用条件包括平台拥有大规模的商品信息和用户数据,并且能够追踪和记录用户的详尽历史交互信息。数据的范围主要涵盖了商品数据库、用户个人信息以及详尽的用户交互行为数据。主要应用对象为电商平台的用户群体和平台运营方。 通过算法模型对用户交互行为的分析,能够准确地锁定目标用户,提高召回效率,减少客户流失,从而实现商业价值的最大化。

算法/方法论

商品侧:itemId 作为id特征进行embedding操作,item_name、item_desc做文本的嵌入表征,price做分桶操作后得到离散特征同时也做embedding操作,category作为类别特征做embedding操作;用户侧:userId作为id特征进行embedding操作,用户的性别和省份作为类别特征做embedding操作,用户的年龄需要分桶后做为离散特征和分桶操作,此外用户的各种行为序列包括(view_history、click_history、collect_history、buy_history)都会做embeddding操作,在这些特征处理的基础上使用MMOE模型,训练模型后使用模型推断,加权输出获得线上排序得分。 在获得基础排序得分的基础上还需要进行多样性打散和流量调控等操作。对于多样性打散而言,主要是对获取的商品向量表征,基于DPP多样性模型进行排序的重调整;对于流量调控而言,主要是对获取实施的商品曝光、点击等数据进行基于流量目标的调整,使用强化学习Q-Learning 以及 PID控制技术进行流量调控,确保不同类型商品的曝光量符合整体策略。

字段定义
字段名 类型 描述
商品信息 -- --
用户信息 -- --
用户历史交互 -- --
样本数据
fieldName exampleValue
商品信息 {itemId:123, item_name:手机, item_desc:智能手
用户信息 {userId:001, age:25, gender:男, province:
用户历史交互 {userId:001, view_history:[123,334,554],
调用API获取完整数据
基本信息
数据格式
--
数据类型
--
记录数量
101
所属行业
信息传输、软件和信息技术服务业
登记企业
杭州网易再顾科技有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/30899
认证信息
证书编号
20231233000006561
登记编号
SZ2023120006561.6