[发明专利]一种招聘简历自动筛选方法在审
申请号: | 202010619694.2 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111754208A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 邱继钊;杨胜华 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/35;G06K9/62;G06F16/332 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 招聘 简历 自动 筛选 方法 | ||
本发明提供一种招聘简历自动筛选方法,属于文本提取技术领域,本发明利用Text‑Rank算法提取招聘简历信息中的关键词,并利用多标记分类方法ML‑KNN对招聘简历进行分类,基于关联规则挖掘简历与应聘岗位的关联度,建立招聘简历自动筛选模型。为招聘公司节省了从海量简历中人工筛选符合岗位简历的工作和时间。
技术领域
本发明涉及自然语言处理中的文本提取,同时涉及多标记分类领域,尤其涉及一种招聘简历自动筛选方法。
背景技术
互联网时代,互联网信息在社会和生活中的地位越来越显著,人们的购物、交流、生活方式也随之改变。随着招聘网站的兴起,企业的主要招聘途径也转向由招聘网站公布招聘信息,应聘人员原来通过线下投递简历的方式也由线上投递简历所替代,双方通过招聘网站进行招聘的方式大大方便了企业与个人。
多标记学习问题是国际机器学习领域的一个研究热点,它最初来源于文档分类问题中所遇到的歧义性问题。在传统监督学习框架下,真实世界的对象与其概念标记之间是一一对应的关系,一般认为,这样的学习问题是没有歧义性的,我们称这类问题为单标记分类问题,即一个样例仅具有单一的标记。然而,在真实世界的问题中,歧义性对象却是广泛存在的。由于歧义性问题的存在,一个样例可能与多个标记相关联,这类问题为多标记分类问题。多标记学习在现实生活中具有广泛的应用,像视频自动标注、生物信息学、Web挖掘、信息检索、个性化推荐等现实应用中。
关联规则(Association rule)是知识发现领域中最活跃的研究方法之一,是Agrawal等在1993年首先提出的,用于挖掘顾客交易数据库中不同商品(项)之间的关联关系,这些规则反映了用户购买行为模式。关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。
TextRank算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的PageRank算法,通过把文本分割成若干组成单元(单词、句子)并建立图模型,利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘。和LDA、HMM等模型不同,TextRank不需要事先对多篇文档进行学习训练,因其简洁有效而得到广泛应用。TextRank算法,首先会对提供的句子进行分词操作,得到的分词放入到一个集合中,分词的重要程度,主要看这个分词的前后邻居有多少,邻居越多,给它投票的分词就越多,权值越高,也就越重要,当这个分词出现的持续越多,它的邻居也越多;这个分词越在中间(相比开头和结尾),它的邻居也越多。TextRank算法的主要用途有两个方面,一是提取出文本中比较重要的关键词,二是选出一段话中哪个关键词出现的次数多的问题
在机器学习中,训练算法模型主要有三步:一是预处理数据;二是选定合适的算法模型;三是基于训练样例训练模型,并得到最优算法模型。
随着互联网的普及与应用,信息载体逐渐由纸质报刊向互联网信息过渡。随着招聘网站的广泛兴起,企业招聘信息的发布也逐渐由纸质报刊转向互联网上的各类招聘网站。现如今,招聘网站已成为企业与应聘者发布及获取招聘信息的主要途径,招聘环节中的简历投递、岗位筛选环节也都是通过互联网线上完成。而应聘者为了增加找到工作的概率,经常会采取广撒网的方式投递简历。广撒网虽然能够增加应聘者找到工作的可能性,但对企业来说却无疑增加了很大的工作量用来筛选与岗位不匹配的简历。如何从海量简历中快速且准确的找到符合自身要求的人才,成为企业面临的一个重大难题。
发明内容
为了解决以上技术问题,本发明提供了一种招聘简历自动筛选方法,能够根据应聘与招聘双方发布的信息实现简历的自动筛选,在很大程度上节约企业的时间与消耗成本,提高最终结果的精准度,使得企业可以在较短时间内找到符合要求的简历及人才。
本发明的技术方案是:
一种招聘简历自动筛选方法,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010619694.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理