用于支撑电商平台的个性化推荐、精准广告投放、私域用户运营、内容策略匹配、促销活动分层设计等场景,通过构建动态用户画像,实现“千人千面”的智能营销,有效提升转化率、复购率与客单价。
本系统采用“数据融合 → 特征工程 → 混合聚类 → 动态打标 → 实时更新”五阶段算法架构,各阶段与数据字段严格对应: 1.数据输入与预处理: 系统采集用户行为日志,生成以下基础字段: 近7天浏览商品次数(browse_freq_week):衡量短期活跃度; 距离上次购买天数(last_purchase_days):识别流失或高活跃用户; 近30天商品分享次数(social_share_cnt):评估社交影响力; 历史平均客单价(元)(avg_order_value) 与 最常收藏品类(fav_category):刻画消费能力与兴趣偏好。 2.人群聚类与标签生成: 基于上述字段构建特征向量,采用 K-Means 与 DBSCAN 混合聚类算法,自动发现潜在人群分组; 结合业务规则与机器学习模型,生成 动态人群标签(crowd_label),例如: 若 历史平均客单价(元)(avg_order_value) ≥ 800 且 最常收藏品类(fav_category) 为“数码”或“奢品”,则打标为“高客单价偏好人群”; 若 距离上次购买天数(last_purchase_days) ≤ 30 且 近30天商品分享次数(social_share_cnt) ≥ 3,则打标为“高活跃社交用户”。 3.实时更新机制: 用户每产生一次有效行为(如浏览、下单、分享),系统触发流式计算; 在5分钟内重新计算相关字段,并更新 动态人群标签(crowd_label) 与 画像更新时间(update_timestamp); 脱敏用户ID(user_id) 作为唯一键,确保画像数据准确关联至对应用户。 通过 “近7天浏览商品次数(browse_freq_week) + 历史平均客单价(元)(avg_order_value) + 距离上次购买天数(last_purchase_days)” 等多维字段联合建模,实现动态、可解释、可运营的用户分群,非静态规则标签
| 字段名 | 类型 | 描述 |
|---|---|---|
脱敏用户ID(user_id) |
-- | -- |
近7天浏览商品次数(browse_freq_week) |
-- | -- |
历史平均客单价(元)(avg_order_value) |
-- | -- |
最常收藏品类(fav_category) |
-- | -- |
距离上次购买天数(last_purchase_days) |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 脱敏用户ID(user_id) | U100518,U100502,U100087 |
| 近7天浏览商品次数(browse_freq_week) | 19,13,28 |
| 历史平均客单价(元)(avg_order_value) | 744.25,103.18,615.11 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/7180343