[发明专利]一种基于机器学习的简历质量判断方法在审
申请号: | 201910343057.4 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110069782A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 张刚;芦孙慧;黄龙;余智通;吕巧飞 | 申请(专利权)人: | 西安募格网络科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06N20/00;G06Q10/10 |
代理公司: | 北京金宏来专利代理事务所(特殊普通合伙) 11641 | 代理人: | 杜正国;陆华 |
地址: | 710068 陕西省西安市高*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 质量判断 基于机器 后台管理系统 海量数据库 分工体系 后台运行 模型结果 人力资源 网络结构 业务需求 贝叶斯 运维 整合 排序 匹配 优化 科研机构 后台 反馈 职位 学习 服务 | ||
本发明涉及一种基于机器学习的简历质量判断方法,所述方法主要是根据贝叶斯网络结构进行简历质量的划分,把简历和目标职位需求进行匹配,然后进行简历质量排序,最终自动把把简历质量最好的十个简历反馈与后台管理系统。本发明可以大大优化后台运行成本,节省人力资源,优化部门分工体系等,对于公司海量数据库资源的质量判断,能够整合资源,更好的服务于科研机构和企业人才资源引进,同时本发明能够降低后台运维成本,同时具有较高的模型结果精度,满足了公司科聘部门的业务需求。
技术领域
本发明涉及机器学习领域,尤其涉及一种基于机器学习的简历质量判断方法。
背景技术
在当今经济快速发展的时代背景下,我国对科研科技领域人才的需求量巨大,尤其是顶尖行业人才缺失严重。特别是在“人工智能”、“大数据”和“云计算”有关的岗位需求同比每年呈倍增加,且应届毕业生供给率低,猎头市场活跃。一些公司相关业务是为科研科技领域的招聘单位和求职者提供在线服务的平台,实现科技领域人才需求与供给之间的匹配,目前后台已经积累了大量各行业人才,但是在简历匹配精准度方面还有待提高。
目前,对于简历文档质量判断的方法主要有基于随机森林模型(RF),SVM分类模型,KNN分类模型,神经网络分类模型。其中神经网络分类模型构建需要大量的人工标注词汇,和训练时间,算法构建周期长,设备运行昂贵。因此我们需要一种新的方法进行简历质量判断,减少人力审查简历和标注,减少时间消耗,降低后台运行成本。这是本领域技术人员急需解决的问题。
发明内容
本发明解决的技术问题在于提供一种基于机器学习的简历质量判断方法,可以有效的解决后台运行压力大,人力资源浪费严重的问题。
本发明是通过以下技术方案来实现,包括如下步骤:
步骤1:从后台获取目标简历文本,并把目标简历文本存储于简历数据库文档内;
步骤2:通过简历数据库文档进行文本预处理,使用中文分词对简历文本进行构建数据类型格式,筛选待提取词汇向量。
步骤2包括以下子步骤:
步骤2.1:通过中文分词进行进行专业特有名词进行数据类型格式构建,通过专业特有名词进行简历分类。
步骤2.2:进行技能掌握程度,经验,特有名词,资历进行类别标记;
步骤2.3:对标记类别进行筛选;
步骤3:进行文本特征提取,提取标记名词,进行对预先设定的词向量的数据库进行匹配,构成质量判断词库,形成人才判别标准类别标签;
步骤4:从已知质量的文档中标记词向量,统计词频,根据已有词向量和标记类别训练参数模型,得到学习词向量和标签类别之间的数据特征维度关系和轻量级的训练模型,在未分类的简历文档库上验证该模型的准确率,统计模型的学习效率和在测试集上的准确度。
步骤5:通过训练模型,得到简历质量的判断结果,并将十个最优简历反馈给设备管理平台。
更进一步的:所述建立数据库文档通过后台管理系统进行简历文本上传,生成简历数据库。
更进一步的:所述文本特征提取包括匹配标准包括毕业学校、文化程度、工作经验、以及在某一专业特有的技能术语,主要提取简历中是否出现重点学科以及现有提供职位关键词、以及已工作年限等信息量,并加以统计形成待分类的数据向量。
更进一步的:所述机器学习采用贝叶斯网络结构,通过类别标签作为先验概率,预测未知测试简历文档的质量等级。
附图说明与现有技术相比,本发明具有以下有益的技术效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安募格网络科技有限公司,未经西安募格网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910343057.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体标签的识别方法及相关设备
- 下一篇:一种答题内容评测方法及装置