[发明专利]划分企业所属行业类别的方法、设备及介质有效
申请号: | 202011158181.2 | 申请日: | 2020-10-26 |
公开(公告)号: | CN112347318B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 周祥;陈小霞;葛阳 | 申请(专利权)人: | 杭州数智政通科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 张超 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 划分 企业 所属 行业类别 方法 设备 介质 | ||
本发明公开了一种划分企业所属行业类别的方法、电子设备及计算机存储介质,涉及信息分类技术领域,旨在解决现有技术中难以划分企业所属的新兴行业类别的问题。该方法包含以下步骤:根据每个企业的招聘岗位名称构建初步行业‑招聘岗位矩阵;将初步行业‑招聘岗位矩阵进行相似岗位去重后,进行按列求和,删除求和结果大于阈值的列,得到目标行业‑招聘岗位矩阵;获取目标企业的招聘岗位,将目标企业的招聘岗位与目标行业‑招聘岗位矩阵组成的招聘岗位集合进行匹配,得到岗位向量;将目标行业‑招聘岗位矩阵与岗位向量相乘,得到匹配度集合;将匹配度集合中降序排序第一位的元素的行业作为所述目标企业的行业类别。
技术领域
本发明涉及信息分类技术领域,尤其涉及一种划分企业所属行业类别的方法、设备及介质。
背景技术
随着各地新兴产业的发展,产业的划分成为当前各地政府部门高度关注的问题。然而现行的国民经济行业分类实际上是以往历次技术革命的产物,适应于工业文明成熟期的经济社会形态,而新一代信息技术及其他战略性新兴产业,其领域及行业划分则是适应新一轮科技革命和产业变革要求设定的,也就是说基于现有的统计标准难以直接划分某企业所属的新兴产业类别。
目前针对现有的统计标准难以划分企业所属的新兴行业类别的问题,尚未提出有效的解决方法。
发明内容
本发明实施例提供了一种划分企业所属行业类别的方法、设备及介质,以至少解决现有技术中难以划分企业所属的新兴行业类别的问题。
第一方面,本发明实施例提供了一种划分企业所属行业类别的方法,包括以下步骤:
获取属于不同行业的若干企业的招聘岗位数据,对所述招聘岗位数据进行预处理,得到格式统一的招聘岗位名称;
将每个企业的招聘岗位名称映射为一个向量,以构建初步行业-招聘岗位矩阵,其中所述若干企业的招聘岗位名称构成所述初步行业-招聘岗位矩阵的一个空间,每个招聘岗位名称对应所述初步行业-招聘岗位矩阵的一个维度;
根据所述若干企业的招聘岗位名称进行相似岗位合并,得到相似招聘岗位集合;
根据所述相似招聘岗位集合,将所述初步行业-招聘岗位矩阵中的相似招聘岗位名称对应的列进行横向求和,将所述横向求和结果大于1的值置为1,反之置为0,并通过所述横向求和形成的新列替换所述相似招聘岗位名称对应的所有列,得到新的行业-招聘岗位矩阵;
将所述新的行业-招聘岗位矩阵按列求和,删除按列求和结果大于阈值的列,得到目标行业-招聘岗位矩阵;
将所述目标行业-招聘岗位矩阵中的列分别组成招聘岗位集合,并按照所述目标行业-招聘岗位矩阵的列序号进行对应编号;
获取目标企业的招聘岗位,将所述目标企业的招聘岗位与所述招聘岗位集合中的元素进行匹配,将匹配成功的所述目标企业的招聘岗位赋值为1,反之赋值为0,得到所述目标企业的岗位向量;
将所述目标岗位向量与所述目标行业-招聘岗位矩阵作乘法运算,得到匹配度集合;
将所述匹配度集合中的元素进行降序排列,将排序第一位的元素对应的行业作为所述目标企业的行业类别。
在其中一些实施例中,所述获取属于不同行业的若干企业的招聘岗位数据之前,包括:
通过网络爬虫技术从网页抓取所述属于不同行业的若干企业的招聘岗位数据。
在其中一些实施例中,所述对所述招聘岗位数据进行预处理,得到格式统一的招聘岗位名称,包括:
对所述招聘岗位数据进行清洗,形成格式统一的招聘岗位名称。
在其中一些实施例中,所述构建初步行业-招聘岗位矩阵,还包括:
设置所述初步行业-招聘岗位矩阵的每个维度的坐标值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数智政通科技有限公司,未经杭州数智政通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011158181.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电镀废水处理池
- 下一篇:一种交通参与者的信息生成方法及系统