[发明专利]一种精准推理用户属性实体的方法、系统、设备和存储介质在审
申请号: | 202111231043.7 | 申请日: | 2021-10-22 |
公开(公告)号: | CN113987145A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 徐小磊;沈玉军;刘建华;邢继风 | 申请(专利权)人: | 智联(无锡)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/242;G06F40/295;G06Q10/10 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张莹 |
地址: | 214000 江苏省无锡市无锡经济开发*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 精准 推理 用户 属性 实体 方法 系统 设备 存储 介质 | ||
本发明公开了一种精准推理候选人用户工作单位属性实体的方法,包括S1:从多个指定列表字段分别抽取用户的个人属性实体信息,对所述个人属性实体信息进行数据清洗;S2:对清洗后的数据进行问询,若问询结果无效,则直接执行S7,若问询结果有效,则执行S3;S3:对步骤S2中的问询信息进行抽取,解析实体属性名称,生成实体属性特征;S4:将所述生成的实体属性特征与公司标准实体库数据执行标准匹配;S5:判断标准匹配是否有结果,如果有结果,则得到标准匹配结果;若匹配无结果,则执行步骤S6;S6:进行推理匹配,得到推理匹配结果S7:返回结果。本发明可有效提高工作单位属性实体识别的精确率,满足使用需求,有利于使用。
技术领域
本发明涉及方法技术领域,具体地说,涉及一种便于内部检索的数据归一化处理方法,尤其涉及一种精准推理用户属性实体的方法、系统、设备和存储介质。
背景技术
在推理用户属性实体中,通过对求职者属性的初步统计,仅不到40%的求职者填写了标准的属性名称,剩余60%的用户填写不标准,在进行识别的过程中,经常出现名称多样化、过于简洁、信息不明确等等问题,导致后续对属性的画像不精准,进而影响识别精确率,从而影响B/C端用户匹配准确率,不能满足使用需求。
例如,C端求职者的工作经历中对同一工作单位的描述多种多样,如:“美团”、“三快在线”、“美团点评”等;C端求职者对工作单位的描述过于简洁,如:“TCL”,但是涉及“TCL”的实体有“TCL科技集团股份有限公司”、“TCL空调器(中山)有限公司”、“科天智慧云(广州)信息科技有限公司”等;C端求职者的工作单位描述与求职信息不明确,如:工作单位为“湖南顺丰速运”,当前所在地为广东-广州等;如何排序总公司与分公司,如:工作经历的工作单位为“宜信财富芜湖分公司”,如何排序总公司与分公司等。
也就是说,在同一项目(例如,智联招聘项目)中,用户通过各类平台例如APP/网页等,将个人的属性实体信息输入到项目系统中。但是,针对同一内容,例如,同一工作单位,不同用户的描述就不同。
因此我们提出了一种精准推理用户属性实体的方法用于解决上述问题。
发明内容
基于背景技术存在的技术问题,本发明提出了一种精准推理用户属性实体的方法。
以招聘平台为例,通过对求职者工作单位的初步统计,仅不到40%的求职者填写了标准的工作单位名称,剩余60%的用户填写不标准,出现名称多样化、过于简洁、信息不明确等等问题,导致后续对工作单位的画像不精准,从而影响B/C端用户匹配准确率。
如,对于需要信息整合的系统内部,由于获取信息的来源不同,获取的数据质量也良莠不齐,导致对同一信息实体的描述多样化,比如“阿里巴巴”,存在“阿里巴巴(中国)有限公司”、“阿里”、“alibaba”、“阿里巴巴(杭州)”、“高德地图(阿里)”、“天猫”等等多种实体描述。因此,为了解决不同数据源的数据重复问题,更大的挖掘数据的价值,该字段中,必须进行用户属性实体的精准推理,也就是数据的归一化处理(知识实体的融合)。
本发明提出的一种精准推理用户属性实体的方法,包括以下步骤:
S1:从多个指定列表字段分别抽取用户的个人属性实体信息,对所述个人属性实体信息进行数据清洗;
S2:对清洗后的数据进行问询,若问询结果无效,则直接执行S7,若问询结果有效,则执行S3;
S3:对步骤S2中的问询信息进行抽取,解析实体属性名称,生成实体属性特征;
S4:将所述生成的实体属性特征与公司标准实体库数据执行标准匹配;
S5:判断标准匹配是否有结果,如果有结果,则得到标准匹配结果;若匹配无结果,则执行步骤S6;
S6:进行推理匹配,得到推理匹配结果;
S7:返回结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智联(无锡)信息技术有限公司,未经智联(无锡)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111231043.7/2.html,转载请声明来源钻瓜专利网。