[发明专利]一种基于履历大数据的人员任免辅助决策方法及系统有效
申请号: | 202110813044.6 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113673943B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 刘志威;朱勇赤;陈褀琪;李阳;张林;孔德旭;彭志远;李可 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/35;G06F16/36;G06F40/242;G06F40/289;G06F40/295;G06F18/241;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 履历 数据 人员 任免 辅助 决策 方法 系统 | ||
1.一种基于履历大数据的人员任免辅助决策方法,其特征在于,具体包括如下步骤:
S1、接收人员简历文本,通过中文简历文本处理算法处理人员简历文本;
S2、基于专家规则与知识图谱进行混合短文本多标签分类;
S3、基于从简历大数据中提取的组织机构树构建人员的职业社交网络;
S4、基于查询条件获取符合要求的人员信息,对人员的职业社交网络进行可视化呈现;
所述中文简历文本处理算法具体包括:
S11、对文本进行预处理,去除文本中的规范以外的不规则字符,把文本整理成较为整齐的语句条目形式以便后续的算法分词;
S12、把文本输入到预训练的模型中对词组进行分类以及分词;
所述混合短文本多标签分类包含两条路径:
S21、不依赖分词结果与知识图谱的基于专家规则的分类,直接接收原始简历文本,给出端到端的多标签预测;
S22、基于所述步骤S1得到的分词结果,构成知识图谱,通过知识图谱嵌入的方法获得文本表征,给出标签预测结果;
所述基于专家规则的分类模拟了人类专家对短文本简历数据的类别判断,所述专家规则由三层逻辑组成,分别为:
a、标签分组,针对同类且互斥的标签进行分组组织,当一条新的经历文本属于某个标签组时,该经历文本将会映射到该标签组内的唯一的标签;
b、存在特征,分类器的标签组针对接收到的经历文本,从特定的单词/正则词典中进行贪心匹配,若匹配失败,则选择标签组内默认的标签;
c、消除特征,标签组内包含指代标签不存在的词典,当经历文本与指代标签不存在的词典匹配失败,则认为该经历文本确实与标签组关联,否则,则认为标签组内不存在与该经历文本相应的标签映射;
所述知识图谱嵌入指的是将图谱中包含实体和关系的组成部分嵌入到连续向量空间中,保持知识库的固有结构的同时以增强下游工作,具体包括,图谱中主要包含了三种连接关系:简历实体与标签实体的连接关系,若干标签之间存在的排斥关系和地址、机构、职位实体存在的归属关系,为图谱中所有三元组定义一个打分函数,将损失函数定义为图谱中所有三元组的打分函数之和,通过反向传播,图谱中所有的实体与关系最终会逐渐收敛于低纬度的嵌入空间,在简历数据集上进行训练,将文本表征结果保存下来,根据嵌入结果获得文本表征;
从而基于知识图谱的经历标签分类,以分词与标签构建实体与关系,结合知识图谱嵌入得到有效的文本表征,给出分类预测,解决了机器学习方法难以处理的样本稀疏问题,同时兼顾了专家系统的知识体系,可以实时分类新的简历数据。
2.根据权利要求1所述的基于履历大数据的人员任免辅助决策方法,其特征在于,所述中文简历文本处理算法还包括:
S13、对兼职进行处理,将经过处理的结果存入数据库,为后续处理做准备。
3.根据权利要求2所述的基于履历大数据的人员任免辅助决策方法,其特征在于,将双向长短时记忆神经网络模型与条件随机场方法结合的BiLSTM-CRF方法作为分词的模型。
4.根据权利要求1所述的基于履历大数据的人员任免辅助决策方法,其特征在于,所述构建人员的职业社交网络具体包括:
S31、构建前缀树;
S32、提取同事和上下级关系;
S33、将同事节点保存至同事关系数据库,将上下级节点保存至上下级关系数据库;
S34、生成人员的职业社交网络。
5.根据权利要求4所述的基于履历大数据的人员任免辅助决策方法,其特征在于,同事和上下级的计算过程包括:
S321、在前缀树中筛选出包含当前年限的节点,记为qualified_leave;
S322、对每一个qualified_leave进行深度为3的广度优先算法遍历,当找到距离为2的节点,记为同事,当找到距离为3的节点,记为上下级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110813044.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置