[发明专利]一种精准推理用户属性实体的方法、系统、设备和存储介质在审
申请号: | 202111231043.7 | 申请日: | 2021-10-22 |
公开(公告)号: | CN113987145A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 徐小磊;沈玉军;刘建华;邢继风 | 申请(专利权)人: | 智联(无锡)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/242;G06F40/295;G06Q10/10 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 张莹 |
地址: | 214000 江苏省无锡市无锡经济开发*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 精准 推理 用户 属性 实体 方法 系统 设备 存储 介质 | ||
1.一种精准推理用户属性实体的方法,其特征在于,包括以下步骤:
S1:从多个指定列表字段分别抽取用户的个人属性实体信息,对所述个人属性实体信息进行数据清洗;
S2:对清洗后的数据进行问询,若问询结果无效,则直接执行S7,若问询结果有效,则执行S3;
S3:对步骤S2中的问询信息进行抽取,解析实体属性名称,生成实体属性特征;
S4:将所述生成的实体属性特征与公司标准实体库数据执行标准匹配;
S5:判断标准匹配是否有结果,如果有结果,则得到标准匹配结果;若匹配无结果,则执行步骤S6;
S6:进行推理匹配,得到推理匹配结果;
S7:返回结果。
2.根据权利要求1所述的一种精准推理用户属性实体的方法,其特征在于,所述步骤S3具体包括:
S31:加载各类词典;
S32:抽取所述实体属性名称的主要成份;
S33:抽取所述实体属性名称的核心成份;
S34:以序列标注样本数据为基础,基于深度学习算法及实验标注数据实现名称解析,抽取业务领域、机构类型、地域成份三个成份中的一个或多个。
3.根据权利要求2所述的一种精准推理用户属性实体的方法,其特征在于,所述步骤S31中,各类词典包含地域词典、业务领域词典、机构类型词典和高频词典。
4.根据权利要求1所述的一种精准推理用户属性实体的方法,其特征在于,所述步骤S4中,所述标准匹配的步骤可以包括:
S41:一排召回,将S2中数据清洗后的用户输入和用户主要成份mainName和原始用户输入作为召回条件字段,将满足匹配条件的全部实体返回;
S42:二排排序,对所述所有召回的实体进行二次排序。
5.根据权利要求1所述的一种精准推理用户属性实体的方法,其特征在于,所述步骤S6中,所述推理匹配的步骤可以包括:
S61:一排召回。
S62:二排排序。
6.根据权利要求5所述的一种精准推理用户属性实体的方法,其特征在于,所述召回和排序是利用ElasticSearch搜索引擎实现整体的召回排序功能。
7.一种精准推理用户属性实体的系统,其特征在于,包括以下模块:
数据清洗模块,从多个指定列表字段分别抽取用户的个人属性实体信息,对所述个人属性实体信息进行数据清洗;
问询有效确认模块,将清洗后的数据通过问询模块对其信息进行问询,判断问询结果是否有效;
特征生成模块,对所述问询信息进行抽取,进行实体属性名称解析,生成实体属性特征;
标准匹配模块,将所述生成的实体属性特征与公司标准实体库数据执行标准匹配;
判断模块,判断标准匹配是否有结果;
推理匹配模块,当标准匹配无结果时,通过召回和排序得到推理匹配结果;
返回模块,返回结果。
8.根据权利要求7所述的一种精准推理用户属性实体的系统,其特征在于,所述特征生成模块包括:
加载单元,用于加载各类词典;
第一抽取单元:抽取所述实体属性名称的主要成份;
第二抽取单元:抽取所述实体属性名称的核心成份;
抽取单元,以序列标注样本数据为基础,基于深度学习算法及实验标注数据实现名称解析,抽取业务领域、机构类型、地域成份三个成份中的一个或多个。
9.一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现上述权利要求1-6任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智联(无锡)信息技术有限公司,未经智联(无锡)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111231043.7/1.html,转载请声明来源钻瓜专利网。