[发明专利]使用实体分辨识别重复方的系统在审
申请号: | 202010821182.4 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112445837A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 卢树言;马忆惠;S·海斯;王炜晨;E·索尔克尔德 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 姚杰 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 实体 分辨 识别 复方 系统 | ||
1.一种用于在数据处理系统中执行实体分辨的计算机实现的方法,所述数据处理系统包括处理设备和包含指令的存储器,所述指令由所述处理设备执行,所述方法包括:
接收包含描述第一实体的第一实体特征和描述第二实体的第二实体特征的数据集;
由所述处理设备使用所述第一实体特征和所述第二实体特征执行基于规则的匹配,以尝试基于一个或多个存储的规则识别所述第一实体和所述第二实体之间的关系;
由所述处理设备使用所述第一实体特征和所述第二实体特征执行机器学习匹配,以尝试基于一个或多个机器学习算法识别所述第一实体和所述第二实体之间的关系;
由所述处理设备基于所述基于规则的匹配以及所述机器学习匹配二者的一个或多个生成叙述输出,所述叙述输出声明所述第一实体和所述第二实体之间的识别的关系;
将所述叙述输出提供给用户接口。
2.根据权利要求1所述的方法,其中所述一个或多个存储的规则包括已知关系的定义,其中如果所述第一实体特征和所述第二实体特征匹配一个或多个定义,则确定所述第一实体和所述第二实体之间的所述关系。
3.根据权利要求1所述的方法,其中所述一个或多个机器学习算法包括用于评级所述第一实体特征和所述第二实体特征之间相似度的算法。
4.根据权利要求3所述的方法,其中生成叙述输出包括将所述相似度评级匹配给和关系相关的已知信息。
5.根据权利要求1所述的方法,其中所述机器学习匹配包括应用算法以判断所述第一实体和所述第二实体具有给定关系的概率。
6.根据权利要求1所述的方法,其中所述叙述输出包括定义所述第一实体和所述第二实体之间关系的文本信息和置信度分数。
7.根据权利要求6所述的方法,其中所述文本信息包括多个潜在关系,并且所述置信度分数是每个潜在关系是正确的概率。
8.根据权利要求1所述的方法,进一步包括:通过所述处理设备基于已知信息确定一个或多个度量以评估所述叙述输出并且基于所述一个或多个度量调整基于规则的模块、机器学习模块或者叙述模块的一个或多个。
9.根据权利要求8所述的方法,其中所述一个或多个度量包括实体大小分析、置信度分数分布和置信度阻断中的一个或多个。
10.根据权利要求9所述的方法,进一步包括将所述一个或多个度量提供给所述用户接口。
11.一种实体分辨系统,包括处理设备和存储器,所述存储器包含指令,所述指令当被所述处理设备执行时,对由所述实体分辨接收的数据集执行实体分辨,所述数据集至少包括第一实体的第一实体特征和第二实体的第二实体特征,所述实体分辨系统进一步包括:
基于规则的模块,被配置为比较所述第一实体特征和所述第二实体特征并且确定是否有规则识别所述第一实体和所述第二实体之间关系;
机器学习模块,被配置为对所述第一实体特征和所述第二实体特征的相似性进行评级;以及
叙述模块,被配置为:
基于所述基于规则的模块和所述机器学习模块的一个或多个生成叙述输出,所述叙述输出声明所述第一实体和所述第二实体的识别的关系;以及
将所述叙述输出提供给用户接口。
12.根据权利要求11所述的实体分辨系统,其中如果找到识别所述第一实体和所述第二实体的所述关系的规则,则所述叙述输出包括所述基于规则的模块的输出。
13.根据权利要求11所述的实体分辨系统,其中生成所述叙述输出包括将所述相似度评级从所述机器学习模块匹配到和关系相关的已知信息。
14.根据权利要求11所述的实体分辨系统,其中所述机器学习模块被配置为判断所述第一实体和所述第二实体具有给定关系的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010821182.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用实体分辨识别重复方的系统
- 下一篇:伸缩管道