[发明专利]简历解析方法、装置、电子设备和存储介质有效
申请号: | 201910973521.8 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110781658B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 罗强 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/295;G06Q10/105 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 徐雅琴 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 简历 解析 方法 装置 电子设备 存储 介质 | ||
1.一种简历解析方法,其特征在于,包括以下步骤:
根据实际应用需要预先确定核心实体、以及与所述核心实体对应的多个属性字段;其中,所述核心实体包括企业名称和学校名称;
通过预设命名实体识别算法对简历进行识别,获取多个候选核心实体;其中,所述候选核心实体与所述核心实体相对应;
获取每一个候选核心实体对应的文本信息中的各个实体;其中,所述各个实体包括时间实体、职位实体和专业实体;
根据所述每一个候选核心实体对应的文本信息中的各个实体,对所述每一个候选核心实体对应的多个所述属性字段进行填充,生成与所述每一个候选核心实体对应的结构化数据;
根据所述每一个候选核心实体对应的结构化数据生成与所述简历对应的简历内容。
2.如权利要求1所述的方法,其特征在于,核心实体为企业名称,所述多个属性字段为时间属性字段和职位属性字段;
根据所述每一个候选核心实体对应的文本信息中的各个实体对每一个候选核心实体对应的多个属性字段进行填充生成与所述每一个候选核心实体对应的结构化数据,包括:
若候选核心实体所在行中存在时间实体,且所述时间实体的个数为2个,则将所述时间实体填充到所述时间属性字段中;
若所述文本信息中存在职位实体,则将所述职位实体填充到所述职位属性字段;
根据所述候选核心实体、所述时间属性字段和所述职位属性字段生成与所述每一个候选核心实体对应的所述结构化数据。
3.如权利要求2所述的方法,其特征在于,还包括:
若候选核心实体所在行中不存在时间实体,则在所述文本信息中按照行顺序查找时间实体,若在任一行仅存在时间实体,且所述时间实体的个数为2个,则将所述时间实体填充到所述时间属性字段中。
4.如权利要求1所述的方法,其特征在于,在所述根据所述每一个候选核心实体对应的结构化数据生成与所述简历对应的简历内容之前,还包括:
判断所述每一个候选核心实体对应的结构化数据是否满足预设规则;
若存在目标候选核心实体对应的结构化数据不满足所述预设规则,则将所述目标候选核心实体对应的结构化数据进行删除处理。
5.如权利要求1所述的方法,其特征在于,在所述根据所述每一个候选核心实体对应的结构化数据生成与所述简历对应的简历内容之前,还包括:
判断所述每一个候选核心实体对应的结构化数据是否满足预设合并条件;
若存在任两个候选核心实体对应的结构化数据满足所述预设合并条件,则将所述两个候选核心实体对应的结构化数据进行合并处理。
6.一种简历解析装置,其特征在于,包括:
设置模块,用于根据实际应用需要预先确定核心实体、以及与所述核心实体对应的多个属性字段;其中,所述核心实体包括企业名称和学校名称;
识别获取模块,用于通过预设命名实体识别算法对简历进行识别,获取多个候选核心实体;其中,所述候选核心实体与所述核心实体相对应;
获取模块,用于获取每一个候选核心实体对应的文本信息中的各个实体;其中,所述各个实体包括时间实体、职位实体和专业实体;
填充模块,用于根据所述每一个候选核心实体对应的文本信息中的各个实体,对所述每一个候选核心实体对应的多个所述属性字段进行填充,生成与所述每一个候选核心实体对应的结构化数据;
生成模块,用于根据所述每一个候选核心实体对应的结构化数据生成与所述简历对应的简历内容。
7.如权利要求6所述的装置,其特征在于,还包括:
第一判断模块,用于判断所述每一个候选核心实体对应的结构化数据是否满足预设规则;
删除模块,用于若存在目标候选核心实体对应的结构化数据不满足所述预设规则,则将所述目标候选核心实体对应的结构化数据进行删除处理。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5任一所述的简历解析方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一所述的简历解析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910973521.8/1.html,转载请声明来源钻瓜专利网。