返回数据集列表
数据集 台州浩瀚网络有限公司

求职招聘系统岗位简历匹配数据

价格待定
数据描述

通过企业岗位和求职者求职意向的分析,尽享相互匹配推荐,缩短用户搜索行为路径,直接根据需求推荐合适的简历。通过预设的K‑means算法模型确定出每个数据点与聚类中心的距离,该数据点与聚类中心越相似,则该数据点对应的简历与聚类中心对应的岗位类型的契合程度越高。然后根据契合度高低对待推荐简历进行推荐,可以有效提高简历推荐的成功率。

算法/方法论

数据采集:从预先存储的简历数据库中,选出若干份简历。 数据处理:提取简历中的预设类别的信息,包括:学历、工作年限、技能、期望薪资等,将预设类别的信息进行标准化处理,形成简历训练数据集。对于文本数据,采用LabelEncoder将预设类别的信息中的文本数据处理为数字信息。对于工作年限、期望薪资等数据,采用min-max标准化(Min-Max Normalization)对此类预设类别的信息进行归一化处理,将数据缩放到0-1之间。 数据分析:采用K-means算法模型分析,先假设已经通过聚类将数据分成了K个簇,对簇中的每个向量,计算其轮廓系数。当轮廓系数取值范围为(-1, 1)时,轮廓系数越接近于1,则聚类效果越好,越接近-1,聚类效果越差,从而确定K的最佳值。从数据集中随机选择K个数据点作为质心。计算每个数据点与这K个质心之间的距离,将其划分给与其距离最近的质心,初步将数据集分为K类。在分好的K个类别中,计算每个类别所属的数据点的中心点作为新的K个质心。直至收敛,生成与聚类中心对应的簇及数据点对应的契合度。距离聚类中心越近的数据点,契合度越高,根据契合度高低对待推荐简历进行推荐。

字段定义
字段名 类型 描述
招聘岗位类别 -- --
招聘岗位 -- --
工资 -- --
工作年限 -- --
学历 -- --
样本数据
fieldName exampleValue
招聘岗位类别 行政
招聘岗位 文员
工资 5000-7000
调用API获取完整数据
基本信息
数据格式
--
数据类型
--
记录数量
2607
所属行业
信息传输、软件和信息技术服务业
登记企业
台州浩瀚网络有限公司
V6 评分明细
描述质量 0.0 / 20
结构规范 0.0 / 20
规模时效 0.0 / 15
安全合规 0.0 / 20
认证标注 0.0 / 15
商业价值 0.0 / 10
API 调用示例
curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/7390
认证信息
证书编号
20230933000001921
登记编号
SZ2023120001921.1