[发明专利]证件验证方法、装置、电子设备、存储介质有效
申请号: | 201911122397.0 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110928919B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 任天成;徐鹏飞 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证件 验证 方法 装置 电子设备 存储 介质 | ||
本发明公开了证件验证方法、装置、电子设备、存储介质。所述证件验证方法包括:提取待验证证件的证件信息,所述证件信息包含证件号码和其他证件信息;验证所述待验证证件的证件号码和其他证件信息是否满足证件信息的关联规则,其中,所述关联规则由多份证件的证件信息中证件号码与除所述证件号码之外的其他证件信息的互信息建立;根据验证结果确定所述待验证证件的真伪。本发明中基于互信息建立证件信息的关联规则,能够挖掘出证件号码与其他证件信息之间的潜在规则,以此对证件进行鉴伪,能够提高证件鉴伪的准确度。
技术领域
本发明涉及数据挖掘技术领域,特别涉及证件验证方法、装置、电子设备、存储介质。
背景技术
目前,证件鉴伪主要通过业务专家长期工作的实践,总结出证件信息的关联规则,进而基于结构化文本的关联规则逻辑匹配实现。然而,基于人工方式挖掘证件信息的关联规则,不仅需要大量的人力投入,且人工并不能挖掘出除经验之外的潜在规则,会导致因证件信息的关联规则挖掘不全面,影响证件鉴伪的准确性。
发明内容
本发明提供证件验证方法、装置、电子设备、存储介质,以提高证件鉴伪的准确性。
具体地,本发明是通过如下技术方案实现的:
第一方面,提供一种证件验证方法,所述证件验证方法包括:
提取待验证证件的证件信息,所述证件信息包含证件号码和其他证件信息;
验证所述证件号码与所述其他证件信息是否满足证件信息的关联规则,其中,所述关联规则由多份证件信息包含的证件号码与其他证件信息的互信息建立;
根据验证结果建立所述待验证证件的真伪。
可选地,由多份证件信息包含的证件号码与其他证件信息的互信息建立所述关联规则,包括:
分别对每份证件信息的证件号码进行号码段的截取,并将从多个证件号码中截取得到的位数和数位均相同的号码段划分至相同的号码段集中;
分别计算每一号码段集与所述其他证件信息之间的互信息;
根据所述互信息建立所述关联规则。
可选地,分别计算每一号码段集与其他证件信息之间的互信息,包括:
从多个包含位数相同的号码段的号码段集中选取目标号码段集,所述目标号码段集为与所述其他证件信息的互信息为最大值的号码段集;
将所述目标号码段集中的号码段与其他号码段集中对应的号码段进行组合,并计算组合后的号码段集与所述其他证件信息的互信息。
可选地,分别计算每一号码段集与其他证件信息之间的互信息,包括:
分别计算每个号码段集与所述其他证件信息的互信息;
按照所述互信息由大到小的顺序对所述号码段集进行排序;
选取排序靠前的若干号码段集,并将所述若干号码段集中对应的号码段进行组合;
计算组合后的号码段集与所述其他证件信息的互信息。
可选地,根据所述互信息建立所述关联规则,包括:
计算所述互信息大于互信息阈值的号码段集的置信度;
根据置信度大于置信度阈值的号码段集与对应的其他证件信息建立所述关联规则。
可选地,计算所述号码段集与其他证件信息之间的互信息,包括:
统计所述多份证件信息中,所述号码段集中的号码段与对应的证件信息的出现数量,根据所述出现数量建立号码段的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911122397.0/2.html,转载请声明来源钻瓜专利网。