[发明专利]简历筛选方法及装置在审
申请号: | 202210504049.5 | 申请日: | 2022-05-10 |
公开(公告)号: | CN114741538A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 雷真;安波;孙绍军;赵阿民 | 申请(专利权)人: | 图谱天下(北京)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/279;G06F40/30;G06N3/04;G06N3/08;G06Q10/10 |
代理公司: | 北京世衡知识产权代理事务所(普通合伙) 11686 | 代理人: | 张超艳 |
地址: | 100007 北京市东城区青龙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 简历 筛选 方法 装置 | ||
本发明提供简历筛选方法及装置,所述简历筛选方法包括获得符合客户端用人需求的标准简历;按与标准简历相似度由高到低的顺序筛选出至少一个候选简历。本发明采用与符合客户端用人需求的标准简历匹配的方法筛选候选简历,能够更为简单有效的筛选出与客户端用人需求相符的候选人才。
技术领域
本发明属于简历技术领域,具体涉及简历筛选方法及装置。
背景技术
简历匹配在人岗匹配中具有重要的实际应用价值,对于员工个人发展、企业寻找合适的员工和整个社会的人力资源合理分配均有直接应用。目前的人岗匹配主要是基于职位描述(Jobdescr i pt i on,JD)与简历(CV)进行相似度的计算。企业人员通常通过编写JD中的职位指责、任职要求等描述对该职位人员的期望。但是职位描述通常难以描述对职位的完整需求,尤其对经验要求较高的职位更是如此。
文本匹配是自然语言处理领域的常用任务,已经有很多相关的方法与系统,简历匹配与其他文本匹配任务的较大区别,主要包括以下四个方面:
(1)简历结构复杂:简历是一个相对结构化的文本,通常包括个人信息、个人简介、工作经历、项目经历、教育经历等几个主要部分,现有的简历匹配没有考虑不同部分之间的相似度。
(2)简历匹配的计算复杂度高:由于简历规模较大、包含的字段较多且文本较长,采用直接简历与所有候选简历匹配的匹配结果不理想。
(3)术语匹配难度大:传统的文本匹配依赖于字面相似度,然而简历中包含大量的描述胜任力、技能等术语,这些术语字面语义和真实语义差别较大,如“命名实体识别”与“事件抽取”字面上完全不同,但语义上非常相关,因此现有技术容易漏检符合用人需求的语义不同的简历。
发明内容
针对现有技术存在问题中的一个或多个,本发明提供一种简历筛选方法,包括:
获得符合客户端用人需求的标准简历;
按与标准简历相似度由高到低的顺序筛选出至少一个候选简历。
根据本发明的一个方面,所述获得符合客户端用人需求的标准简历的步骤包括:
客户端上传初始简历或/和从简历库调取初始简历,优选地,客户端上传已胜任人才的简历作为初始简历;或/和从简历库调出客户端已胜任人才的简历作为初始简历,所述简历库包括客户端数据库或/和第三方数据库;
将上述初始简历文本化;
将文本化的初始简历结构化,提取内容块,所述内容块包括基本信息、教育经历、工作经历和自我评价的一个或多个;
对内容块进行知识抽取,获得知识信息,所述知识信息包括毕业院校、工作地域、学历、任职公司、职位、项目和技能中的一个或多个;
将知识信息归一化到知识图谱的知识标引,知识标引是知识图谱对简历中知识和实体的标引,形成标准简历。
根据本发明的一个方面,所述将文本化的初始简历结构化的步骤包括:
采用深度学习方法提取初始简历的各字段,一个字段作为一个内容块;
利用规则匹配的方法将内容块进行组合。
根据本发明的一个方面,所述对内容块进行知识抽取的步骤包括:
采用实体识别模型抽取内容块的知识信息,
优选地,所述采用实体识别模型抽取内容块的知识信息的步骤包括:
利用标准术语进行检索;
对标准术语对应的信息采用Bert+BiLSTM+CRF的模型进行抽取;
对于非标准术语对应的信息采用Bert+BiLSTM+MLP模型进行抽取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于图谱天下(北京)科技有限公司,未经图谱天下(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210504049.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路裂缝修补装置
- 下一篇:一种木板表面缺陷修补装置与方法