[发明专利]使用实体分辨识别重复方的系统在审
申请号: | 202010820702.X | 申请日: | 2020-08-14 |
公开(公告)号: | CN112445836A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 卢树言;马忆惠;S·海斯;王炜晨;E·索尔克尔德 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 实体 分辨 识别 复方 系统 | ||
本申请的实施例涉及使用实体分辨识别重复方的系统。一种实体分辨系统,其执行基于数据集解析一个或多个候选实体的方法。该实体分辨系统具有一个机器学习模块,一个叙述模块。所述机器学习模块生成综合数据集,所述综合数据集包含对每个实体特征的相似度评级。所述叙述模块采用聚类分析以为每个实体特征确定所述相似度评级组之间的一个或多个距离,以及和实体之间已知关系相关的一个或多个聚类,基于一个或多个距离生成叙述输出。所述叙述模块声明所述多个候选实体的至少两个实体之间的至少一个识别的关系以及置信度分数。所述叙述引擎还将所述叙述输出提供给用户接口。
技术领域
本发明整体上涉及识别重复方,更具体地,涉及使用实体分辨识别重复方的系统和方法。
背景技术
有很多方法来描绘一个人、地方或者事情。然而,如果不知道其他任何信息,我们怎么知道两个描绘是描述同样的事情?两个不同的实体可能具有同样的名字,而且同样的实体可能还有替代名。数据可能在一个地方是不正确或者不完整的,但在另一个地方不是。这个概念和金融机构数据相关。在一个例子中,当客户试图开一个银行账户,银行的尽职调查步骤应该确定这个客户是否已经有一个账户,是否在筛选清单上,或者是否是具有高风险的人(例如,通过判断该客户和具有一个账户的客户是同一个),甚至给定的信息和已经存储的信息不同。
当银行内部评估他们的客户风险时,使用,例如来自多个账户的信息,给每个账户一个风险值会比给每个客户一个风险值更不准确。获得这个目标的障碍在于,该机构能够或者不能总是知道该客户是和另外一个已知实体相同(或者不同)的实体,因此,是否他们具有多个账户。进而,链接到洗钱者的账户的能力将暴露可疑的交易模式。例如,如果汇出的钱最终汇入他们自己的(不同的)账户,则是可疑的。
本发明描述了和解决是否两个实体是相同或者不同的问题相关的实施例,给出了多组信息以解决如上描述的问题,以及本领域其他相关目标。
发明内容
根据一些实施例,本发明描述了一种用于执行实体分辨的方法。该方法包括:接收一组数据,该组数据包括具有第一实体特征的第一实体,和具有第二实体特征的第二实体,利用机器学习算法来生成综合数据集(synthesized data set),所述综合数据集包括每个实体特征的相似度评级,使用聚类分析(clustering analysis)来确定每个实体特征的该组相似度评级的一个或多个距离,以及与实体之间的已知关系相关的一个或多个聚类(cluster),基于一个或多个距离生成叙述输出(narrative output)。该叙述输出说明多个候选实体的至少两个实体之间的至少一个识别的关系和一个置信度分数。该方法还包括向用户接口提供叙述输出。
根据其他实施例,本发明描述了一种实体分辨系统,其包括一个处理器设备和一个存储器,该存储器包含程序指令,该程序指令被处理器设备执行时,执行对由实体分辨接收的数据集的实体分辨,该数据集包括多个候选实体和相关的实体特征。该实体分辨系统包括机器学习模块和叙述模块。该机器学习模块生成综合数据集,该综合数据集包括每个实体特征的相似度评级。该叙述模块应用聚类分析以为每个实体特征确定该组相似度评级之间的一个或多个距离,以及和实体之间已知关系相关的一个或多个聚类,基于一个或多个具体生成叙述输出。该叙述输出说明该多个候选实体的至少两个实体之间的至少一个识别的关系,以及置信度分数。该叙述引擎还向用户接口提供叙述输出。
通过参考附图进行的以下说明性实施例的详细描述,本公开的附加特征和优点将变得显而易见。
附图说明
当结合附图阅读时,根据以下详细描述可以最好地理解本发明的前述和其他方面。为了说明本发明,在附图中示出了当前优选的实施例,但是应当理解,本发明不限于所公开的特定手段。附图中包括以下:
图1示出了根据本发明实施例的示例服务提供者系统的框图;
图2示出了实现说明性实施例相关方面的示例数据处理系统的框图;
图3是根据本发明实施例的示例实体分辨系统的框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010820702.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:节流装置以及冷冻循环系统
- 下一篇:使用实体分辨识别重复方的系统