[发明专利]用于生成增强型N元模型的系统、方法和计算机程序产品在审

专利信息
申请号: 202080016597.2 申请日: 2020-05-04
公开(公告)号: CN113661486A 公开(公告)日: 2021-11-16
发明(设计)人: 托尼·托马斯·科兰帕兰比尔;穆罕默德·努赛尔 申请(专利权)人: 维萨国际服务协会
主分类号: G06F16/21 分类号: G06F16/21;G06F16/27;G06N20/10;G06N20/20
代理公司: 北京天昊联合知识产权代理有限公司 11112 代理人: 张娜;林文
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 生成 增强 模型 系统 方法 计算机 程序 产品
【说明书】:

提供一种用于生成与监测系统一起使用的增强型n元模型的方法、系统和计算机程序产品。所述方法包括确定第一数据字符串的前导字符对与第二数据字符串的前导字符对不匹配,并且在每个数据字符串中的第一索引位置处插入占位符字符。所述方法还包括在所述第一数据字符串的每个字符对之间插入占位符字符,其中第一字符与所述第二数据字符串中在相同索引位置的字符匹配,并且其中第二字符与所述第二数据字符串中在紧跟相同索引位置之后的索引位置的字符匹配,以及基于所述数据字符串的长度生成相似性得分,以及响应于所述相似性得分超过预定阈值而触发补救过程。

相关申请交叉引用

本申请涉及2019年5月3日提交的第62/842,569号美国临时专利申请,所述美国临时专利申请的公开内容以全文引用的方式并入本文中。

技术领域

本公开大体上涉及数据比较建模,并且在非限制性实施例中,涉及用于生成由监测系统评估和触发补救过程的增强型n元模型的系统、方法和计算机程序产品。

背景技术

计算机化字符串比较是各种数据处理系统的核心功能,例如合规和欺诈检测系统之类的监测系统。然而,标识两个匹配或相关的字符串比逐位等价更复杂。可以表示相同对象或实体的两个字符串在数据字符串序列或排列上可能存在细微差异,使得严格的等效比较将因不匹配而拒绝字符串。例如,名称为“Sara Lynn Smith”的字符串可能与名称为“Sarah Lynn Smith”的字符串指代相同的实体,但严格的等效比较将指示字符串不匹配。漏报(false negatives)会给数据处理系统带来技术复杂性,例如分析被拒绝匹配的计算时间增加、人工审查、由于检测到的匹配的延迟而引起的通信效率损失等。

此外,虽然已经开发了模糊匹配技术来关联非等效字符串,但优化相关数据字符串的标识至关重要。误报(false positives)类似地会给数据处理系统带来技术复杂性,例如作用于不恰当匹配的字符串时的计算时间增加、错误传送的消息、错误的欺诈检测以及计算机关机等。此外,以前的方法可能无法恰当地对比较两组字符串做出解释。例如,一组字符串可以包括名字和姓氏,而第二组字符串可以包括名字、中间名和姓氏。仅将字符串附加到每组中并且直接比较字符串将引起人为的低相似性得分。

本领域需要改进的系统和方法来测量两个字符串的相似性,以便由监测系统基于检测到的匹配字符串触发动作。此外,本领域需要改进的系统和方法来评估包含字符序列或多组字符串的两个字符串是相关的概率。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维萨国际服务协会,未经维萨国际服务协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080016597.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top