依托开发者服务积累的数据,通过图模型、深度学习模型和技术,建立数据向量化技术,助力效果广告模型能力提升,帮助互联网广告平台、品牌方建立和优化广告投放策略,实现广告精准营销和广告投放ROI提升。
在自研的每日治数平台上,构建用户线上行为偏好序列,并利用图和深度学习模型进行训练,最终生成用户的兴趣向量数据。 一、数据抽取、清理和处理 数据抽取:从数据库中抽取用户的APP活跃序列。 数据清理:去除重复、错误或无效的数据记录,处理缺失值和异常值 数据处理:对数据进行必要的转换和整合,如时间戳格式化、APP编码等 二、数据仓库层建设 1.数据模型设计 2.ETL过程 3.数据仓库优化 三、图模型和深度学习模型预训练 图模型构建:根据用户行为偏好序列(APP活跃序列),构建用户与APP之间的图结构,其中节点可以代表用户或APP,边可以代表用户与APP之间的交互行为。 图嵌入学习:利用图嵌入算法(如Node2Vec、GraphSAGE等)学习节点(用户和APP)的嵌入表示,捕捉节点之间的关系和用户的兴趣偏好。 深度学习模型构建:基于用户行为偏好序列和图嵌入结果,构建深度学习模型(如循环神经网络RNN、长短期记忆网络LSTM、Transformer等)来进一步学习用户的兴趣偏好。 四、生成用户兴趣向量数据 将训练好的深度学习模型应用于预测新用户或新数据,通过模型推理生成用户的兴趣向量数据。
| 字段名 | 类型 | 描述 |
|---|---|---|
企业内部设备统一标识符 |
-- | -- |
时间戳 |
-- | -- |
APP安装类别列表 |
-- | -- |
APP活跃类别列表 |
-- | -- |
APP活跃序列 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 企业内部设备统一标识符 | 8916ad81f4fe49a6b4346edcd553230e |
| 时间戳 | 2024-05-31 15:01:10 |
| APP安装类别列表 | 直播类APP、影音制作APP、汽车类APP |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/37799