中信数科 DataTrust 数据市场

数据集台州浩瀚网络有限公司

求职招聘系统岗位简历匹配数据

价格待定

数据描述

通过企业岗位和求职者求职意向的分析，尽享相互匹配推荐，缩短用户搜索行为路径，直接根据需求推荐合适的简历。通过预设的K‑means算法模型确定出每个数据点与聚类中心的距离，该数据点与聚类中心越相似，则该数据点对应的简历与聚类中心对应的岗位类型的契合程度越高。然后根据契合度高低对待推荐简历进行推荐，可以有效提高简历推荐的成功率。

算法/方法论

数据采集：从预先存储的简历数据库中，选出若干份简历。数据处理：提取简历中的预设类别的信息，包括：学历、工作年限、技能、期望薪资等，将预设类别的信息进行标准化处理，形成简历训练数据集。对于文本数据，采用LabelEncoder将预设类别的信息中的文本数据处理为数字信息。对于工作年限、期望薪资等数据，采用min-max标准化(Min-Max Normalization)对此类预设类别的信息进行归一化处理，将数据缩放到0-1之间。数据分析：采用K-means算法模型分析，先假设已经通过聚类将数据分成了K个簇，对簇中的每个向量，计算其轮廓系数。当轮廓系数取值范围为（-1, 1）时，轮廓系数越接近于1，则聚类效果越好，越接近-1，聚类效果越差，从而确定K的最佳值。从数据集中随机选择K个数据点作为质心。计算每个数据点与这K个质心之间的距离，将其划分给与其距离最近的质心，初步将数据集分为K类。在分好的K个类别中，计算每个类别所属的数据点的中心点作为新的K个质心。直至收敛，生成与聚类中心对应的簇及数据点对应的契合度。距离聚类中心越近的数据点，契合度越高，根据契合度高低对待推荐简历进行推荐。

字段定义

字段名	类型	描述
`招聘岗位类别`	--	--
`招聘岗位`	--	--
`工资`	--	--
`工作年限`	--	--
`学历`	--	--

样本数据

fieldName	exampleValue
招聘岗位类别	行政
招聘岗位	文员
工资	5000-7000

调用API获取完整数据

基本信息

数据格式: --
数据类型: --
记录数量: 2607
所属行业: 信息传输、软件和信息技术服务业
登记企业: 台州浩瀚网络有限公司

V6 评分明细

描述质量 0.0 / 20

结构规范 0.0 / 20

规模时效 0.0 / 15

安全合规 0.0 / 20

认证标注 0.0 / 15

商业价值 0.0 / 10

API 调用示例

curl -H "Authorization: Bearer YOUR_API_KEY" \
  http://localhost:3001/api/v1/datasets/7390

获取API密钥已有账户？登录

认证信息

证书编号: 20230933000001921
登记编号: SZ2023120001921.1