[发明专利]身份信息识别方法、装置、计算机设备和存储介质在审
申请号: | 201810144997.6 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108415989A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 鲁永伟 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐清凯 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人属性信息 企业数据 相似度 身份信息识别 计算机设备 存储介质 预设 网页 关联关系 关联数据 数据关联 阈值时 申请 | ||
本申请涉及一种身份信息识别方法、装置、计算机设备和存储介质。所述方法包括:获取网页中的企业数据;根据企业数据获取个人属性信息;对个人姓名相同的多条个人属性信息的相似度进行赋值;若相似度达到预设阈值,则确定相应的个人属性信息对应同一人。采用本方法能够根据网页中的企业数据建立企业数据中的个人及其关联数据之间的关联关系,以获取个人属性信息,并对个人姓名相同的多条个人属性信息的相似度进行赋值,只有当相似度达到预设阈值时,才认为姓名相同的多条个人属性信息对应的是同一人,从而解决了直接将同姓名的人认为是同一人而导致数据关联错误的问题。
技术领域
本申请涉及信息识别技术领域,特别是涉及一种身份信息识别方法、装置、计算机设备和存储介质。
背景技术
目前全国注册的公司数以亿计,各个公司都有独自的法人、股东和高管,在这个群体中姓名相同的人更是很多,如何区分这些同姓名的人是否为同一人则至关重要。
由于受到个人隐私的限制,目前各大信息平台无法提供个人身份证等个人隐私数据,因此,目前无法直接通过个人信息判断这些同姓名的人是否为同一人。如果直接认为这些同姓名的人为同一人,则会出现某些使用度高的名字会拥有很多公司,导致这些数据关联错误而不能使用。
发明内容
基于此,有必要针对上述技术问题,提供一种能够判断同一姓名的人是否为同一人的身份信息识别方法、装置、计算机设备和存储介质。
一种身份信息识别方法,包括:
获取网页中的企业数据;
根据企业数据获取个人属性信息,其中,个人属性信息包括个人姓名以及与个人姓名对应的属性信息;
对个人姓名相同的多条个人属性信息的相似度进行赋值;
若相似度达到预设阈值,则确定相应的个人属性信息对应同一人。
在其中一个实施例中,企业数据包括企业注册的公司名称以及对应的公司法人、公司股东以及公司高管的姓名。
在其中一个实施例中,个人姓名包括公司法人、公司股东或公司高管的姓名中的任一个,则与个人姓名对应的属性信息包括与个人姓名对应的所属公司名称以及公司法人、公司股东、公司高管的姓名。
在其中一个实施例中,对个人姓名相同的多条个人属性信息的相似度进行赋值,包括:
对个人姓名相同的多条个人属性信息按每两条进行分组;
根据分组后的两条个人属性信息,对相同字段对应的值按预设权重进行分别赋值;
累加赋值以获取分组后的两条个人属性信息的相似度。
在其中一个实施例中,对相同字段对应的值按预设权重进行分别赋值,包括:
若相同字段对应的值存在相同项,则根据所述字段对应的预设权重进行赋值。
在其中一个实施例中,预设阈值是通过对已知样本数据分别进行相似度赋值,以获取的最小相似度。
在其中一个实施例中,企业数据包括企业和个人之间的关联数据。
一种身份信息识别装置,包括:
获取模块,用于获取网页中的企业数据;根据企业数据获取个人属性信息,其中,个人属性信息包括个人姓名以及与个人姓名对应的属性信息;
赋值模块,用于对个人姓名相同的多条个人属性信息的相似度进行赋值;
判断模块,用于若相似度达到预设阈值,则确定相应的个人属性信息对应同一人。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810144997.6/2.html,转载请声明来源钻瓜专利网。