通过企业岗位和求职者求职意向的分析,尽享相互匹配推荐,缩短用户搜索行为路径,直接根据需求推荐合适的简历。通过预设的K‑means算法模型确定出每个数据点与聚类中心的距离,该数据点与聚类中心越相似,则该数据点对应的简历与聚类中心对应的岗位类型的契合程度越高。然后根据契合度高低对待推荐简历进行推荐,可以有效提高简历推荐的成功率。
数据采集:从预先存储的简历数据库中,选出若干份简历。 数据处理:提取简历中的预设类别的信息,包括:学历、工作年限、技能、期望薪资等,将预设类别的信息进行标准化处理,形成简历训练数据集。对于文本数据,采用LabelEncoder将预设类别的信息中的文本数据处理为数字信息。对于工作年限、期望薪资等数据,采用min-max标准化(Min-Max Normalization)对此类预设类别的信息进行归一化处理,将数据缩放到0-1之间。 数据分析:采用K-means算法模型分析,先假设已经通过聚类将数据分成了K个簇,对簇中的每个向量,计算其轮廓系数。当轮廓系数取值范围为(-1, 1)时,轮廓系数越接近于1,则聚类效果越好,越接近-1,聚类效果越差,从而确定K的最佳值。从数据集中随机选择K个数据点作为质心。计算每个数据点与这K个质心之间的距离,将其划分给与其距离最近的质心,初步将数据集分为K类。在分好的K个类别中,计算每个类别所属的数据点的中心点作为新的K个质心。直至收敛,生成与聚类中心对应的簇及数据点对应的契合度。距离聚类中心越近的数据点,契合度越高,根据契合度高低对待推荐简历进行推荐。
| 字段名 | 类型 | 描述 |
|---|---|---|
招聘岗位类别 |
-- | -- |
招聘岗位 |
-- | -- |
工资 |
-- | -- |
工作年限 |
-- | -- |
学历 |
-- | -- |
| fieldName | exampleValue |
|---|---|
| 招聘岗位类别 | 行政 |
| 招聘岗位 | 文员 |
| 工资 | 5000-7000 |
curl -H "Authorization: Bearer YOUR_API_KEY" \
http://localhost:3001/api/v1/datasets/7390