[发明专利]用于检测不同语言中的真实姓名的系统和方法在审
申请号: | 201380026811.2 | 申请日: | 2013-05-23 |
公开(公告)号: | CN104335204A | 公开(公告)日: | 2015-02-04 |
发明(设计)人: | 基思·帕特里克·恩赖特;安德鲁·斯维尔德洛;丹·弗雷丁布格 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 不同 语言 中的 真实 姓名 系统 方法 | ||
1.一种检测不同语言中的真实姓名的计算机实现的方法,包括:
使用一个或多个计算装置来接收候选姓名;
使用所述一个或多个计算装置来确定所述候选姓名的人类语言;
使用所述一个或多个计算装置来通过应用用于所述候选姓名的字符集、含义和格式中的至少一个的规则库来分解所述候选姓名的结构,其中,所述规则库对于所确定的人类语言是唯一的;
使用所述一个或多个计算装置相对于实际的真实姓名信息来验证所述候选姓名的所分解的结构的至少一部分,以产生所述候选姓名是实际的真实姓名的置信度;以及
使用所述一个或多个计算装置基于所产生的所述候选姓名是所述实际的真实姓名的置信度来执行行为。
2.根据权利要求1所述的方法,其中,当所产生的置信度等于或大于预定义阈值时,所述行为包括将所述候选姓名存储为所述实际的真实姓名。
3.根据权利要求1所述的方法,其中,当所产生的置信度低于预定义阈值时,所述行为包括提供所述候选姓名未被接受为所述实际的真实姓名的指示。
4.根据权利要求1所述的方法,其中,确定所述候选姓名的人类语言包括:基于Unicode标准来确定文字系统。
5.根据权利要求1所述的方法,其中,所述实际的真实姓名信息包括姓名信息的白名单,并且所述验证包括将所述候选姓名的所分解的结构的所述至少一部分与姓名信息的所述白名单作比较。
6.根据权利要求5所述的方法,其中,所产生的所述置信度为一个阈值或高于该阈值。
7.根据权利要求1所述的方法,其中,所述实际的真实姓名信息包括姓名信息的黑名单,并且,所述验证包括将所述候选姓名的所分解的结构的所述至少一部分与姓名信息的所述黑名单作比较。
8.根据权利要求7所述的方法,其中,所产生的所述置信度低于一个阈值。
9.根据权利要求1所述的方法,进一步包括在姓名信息的白名单中存储所述候选姓名的至少一部分。
10.根据权利要求1所述的方法,进一步包括在姓名信息的黑名单中存储所述候选姓名的至少一部分。
11.一种非瞬时计算机可读介质,其中存储有计算机可执行指令,所述计算机可执行指令用于:
使用一个或多个计算装置来接收候选姓名;
使用所述一个或多个计算装置来确定所述候选姓名的人类语言;
使用所述一个或多个计算装置来通过应用用于所述候选姓名的字符集、含义和格式中的至少一个的规则库来分解所述候选姓名的结构,其中,所述规则库对于所确定的人类语言是唯一的;
使用所述一个或多个计算装置相对于实际的真实姓名信息来验证所述候选姓名的所分解的结构的至少一部分,以产生所述候选姓名是实际的真实姓名的置信度;以及
使用所述一个或多个计算装置基于所产生的所述候选姓名是所述实际的真实姓名的置信度来执行行为。
12.根据权利要求11所述的计算机可读介质,其中,当所产生的置信度等于或大于预定义阈值时,所述行为包括将所述候选姓名存储为所述实际的真实姓名。
13.根据权利要求11所述的计算机可读介质,其中,当所产生的置信度低于预定义阈值时,所述行为包括提供所述候选姓名未被接受为所述实际的真实姓名的指示。
14.根据权利要求11所述的计算机可读介质,其中,确定所述候选姓名的人类语言包括:基于Unicode标准来确定至少一个文字系统。
15.根据权利要求11所述的计算机可读介质,其中,所述实际的真实姓名信息包括姓名信息的白名单,并且所述验证包括将所述候选姓名的所分解的结构的所述至少一部分与姓名信息的所述白名单作比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380026811.2/1.html,转载请声明来源钻瓜专利网。