[发明专利]一种提取职位技能需求的方法和装置有效
申请号: | 201710624771.1 | 申请日: | 2017-07-27 |
公开(公告)号: | CN107506389B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 李智博;董旭;范成伟;李宝环 | 申请(专利权)人: | 北京德塔精要信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/10;G06F40/289;G06F40/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提取 职位 技能 需求 方法 装置 | ||
本发明提供了一种提取职位技能需求的方法和装置,所述方法包括:S1,通过技能词语义网络,获取职位类别下多个技能词分别对应的向量信息;S2,根据所述向量信息获取所述多个技能词的平均向量,并根据所述平均向量进行聚类处理,获取目标技能词;S3,根据所述目标技能词的词频,获取所述职位类别下的技能需求。本发明通过构建技能词语义网络并进行聚类处理,获取相似度较高的目标技能词和技能需求,有效地解决了现有技术中存在的统计不准确的问题,提高了计算精度。
技术领域
本发明涉及数据处理技术领域,具体涉及一种提取职位技能需求的方法和装置。
背景技术
随着互联网技术的高速发展,人们通常通过互联网的招聘网站进行求职。招聘网站通常会根据职位类别对具体的招聘职位进行类别划分,例如职位类别可以包括互联网、金融和医疗等,每个类别下包含具体的招聘信息。招聘网站通常会统计各职位类别的热门技能需求,例如互联网类的热门技能需求通常包括Java开发经验和IOS开发经验,从而帮助求职者更高效地求职。
现有技术中,为了获取某一职位类别的技能需求,通常会在职位数据库中对属于该职位类别的招聘信息进行查询,统计该职位类别下各招聘信息中包含的相关技能需求的数量,根据技能需求的出现频次获取该职位类别下的人们职位需求。
因此,现有技术至少存在以下技术缺陷:由于招聘网站对职位类别的划分只是非常粗略的划分,特定职位类别所包含的招聘职位可能并不属于该职业分类,造成了在统计时将不属于该职业分类的招聘信息进行了统计,使得统计得到的技能需求不准确。
发明内容
针对现有技术中存在的上诉缺陷,本发明提供一种提取职位技能需求的方法和装置。
本发明的一方面提供一种提取职位技能需求的方法,包括:S1,通过技能词语义网络,获取职位类别下多个技能词分别对应的向量信息;S2,根据所述向量信息获取所述多个技能词的平均向量,并根据所述平均向量进行聚类处理,获取目标技能词;S3,根据所述目标技能词的词频,获取所述职位类别下的技能需求。
其中,所述S2中根据所述平均向量进行聚类处理,获取目标技能词的步骤进一步包括:获取所述平均向量的二范数;根据所述二范数对所述多个技能词进行聚类处理,获取所述目标技能词。
其中,所述步骤S1前还包括:获取招聘信息,并对所述招聘信息进行数据清洗;对招聘信息中包含的技能描述信息进行分词处理,获取非技能词表;根据所述非技能词表,对所述技能描述信息进行过滤,获取所述技能词;根据所述技能词构建所述技能词语义网络。
其中,所述步骤S1进一步包括:对所述职位类别下的技能描述信息进行分词处理,并通过所述技能词语义网络获取技能词表;通过所述技能词语义网络,获取所述技能词表中包含的所述多个技能词分别对应的向量信息。
其中,所述S2中根据所述二范数对所述多个技能词进行聚类处理的步骤进一步包括:将所述二范数的近似值、所述职位类别和工作年限作为联合主键进行聚类处理。
其中,所述步骤S3还包括:获取所述职位类别下的平均薪资。
其中,所述根据所述技能词构建所述技能词语义网络的步骤进一步包括:对所述技能词进行word2vec模型训练,获取所述技能词语义网络结构。
本发明另一方面提供一种提取职位技能需求的装置,包括:向量获取模块,用于通过技能词语义网络,获取职位类别下多个技能词分别对应的向量信息;聚类处理模块,用于根据所述向量信息获取所述多个技能词的平均向量,并根据所述平均向量进行聚类处理,获取目标技能词;需求获取模块,用于根据所述目标技能词的词频,获取所述职位类别下的技能需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京德塔精要信息技术有限公司,未经北京德塔精要信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710624771.1/2.html,转载请声明来源钻瓜专利网。