[发明专利]一种招聘简历自动筛选方法在审
申请号: | 202010619694.2 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111754208A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 邱继钊;杨胜华 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/35;G06K9/62;G06F16/332 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 招聘 简历 自动 筛选 方法 | ||
1.一种招聘简历自动筛选方法,其特征在于,
利用Text-Rank算法提取招聘简历信息中的关键词,并利用多标记分类方法ML-KNN对招聘简历进行分类,基于关联规则挖掘简历与应聘岗位的关联度,建立招聘简历自动筛选模型。
2.根据权利要求1所述的方法,其特征在于,包括
1)使用爬虫获取招聘网站中岗位、简历数据;
2)使用Text-Rank算法提取简历、岗位信息中的关键词,将简历关键词作为特征,岗位关键词作为标记,生成训练样例;
3)使用ML-KNN算法模型进行训练得到筛选模型。
3.根据权利要求2所述的方法,其特征在于,
对爬取到的招聘简历信息的先进行预处理。
4.根据权利要求3所述的方法,其特征在于,
利用Text-Rank算法,对处理好后的招聘简历数据进行关键词提取。
5.根据权利要求4所述的方法,其特征在于,
具体步骤如下:
步骤1):数据获取;首先爬取企业招聘信息页面及对应的投递简历信息;抽取出招聘信息中中的岗位要求、技能要求数据,以及简历中的个人技能,得到初始的岗位数据、简历数据;
步骤2):关键词提取;利用Text-Rank算法提取岗位、简历初始数据中的关键词;
步骤3):对步骤2)提取的关键词进行验证,若提取质量较差或准确性较低,则对步骤2)的算法模型进行优化调整,再次进行提取;
步骤4):数据处理;将获取到的岗位、简历关键词信息进行转换预处理,得到分类需要的训练样例;
步骤5):建立筛选模型;根据步骤4)中的训练样例利用ML-KNN算法进行分类器学习,最终建立筛选模型;
步骤6):数次训练筛选模型,使得模型的性能更加稳定。
6.根据权利要求1所述的方法,其特征在于,
将步骤4中的训练样例表示为x1=[x11,x12,x13,…,x1n],对应结果集y={L1,L2,…,Lm},其中标记L取值为0或1,0表示样例不具有该标记,1表示样例具有该标记。
7.根据权利要求6所述的方法,其特征在于,
建立筛选模型Y=f(x),对于未知的样例x,根据模型可预测其适配的岗位,并根据可能性大小计算持有概率,持有概率越大,简历的岗位适配度也就越高。
8.根据权利要求5所述的方法,其特征在于,
根据十折交叉验证方式训练筛选模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010619694.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理