[发明专利]证件图像分类方法、装置、计算机设备及可读存储介质有效
申请号: | 201910979547.3 | 申请日: | 2019-10-15 |
公开(公告)号: | CN111046879B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 黄文韬;刘鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/148;G06V30/19;G06F40/216;G06F40/289 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证件 图像 分类 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种证件图像分类方法,其特征在于,所述方法包括:
获取待分类的证件图像;
基于OCR模型提取所述证件图像中包含的所有字段;
根据所述字段,通过第一预设方式生成所述证件图像的向量;
判断预设的向量集中是否存在与所述证件图像的向量相匹配的向量,其中,所述向量集包括多个通过所述第一预设方式所生成的、对应于不同证件类型的证件图像的向量;
若所述向量集中存在与所述证件图像的向量相匹配的向量,将与所述证件图像的向量相匹配的向量作为目标向量,并根据所述目标向量对应的证件类型确定所述证件图像的证件类型;
所述判断预设的向量集中是否存在与所述证件图像的向量相匹配的向量的步骤之前,还包括:生成所述向量集;其中,
所述生成所述向量集的步骤包括:
获取属于同一个证件类型的多张证件图像;
针对每一张所述证件图像,基于所述OCR模型提取所述证件图像中包含的所有字段,并统计每个所述字段出现的次数以生成每张所述证件图像对应的第一字段集;
对比每个所述第一字段集中包含的字段,筛选出所有所述第一字段集中共有的字段;
从所述共有的字段中按照第二预设方式提取预设数量的共有字段组成第二字段集,所述第二字段集用于作为识别所述证件类型的依据;
将所有所述第二字段集中出现的所有字段组成一个无重复字段的字段总集;
针对每个所述第二字段集,根据所述第二字段集中包含的每个所述字段在对应所述证件类型的证件图像中出现的次数,统计所述字段总集中包含的字段在所述第二字段集中出现的次数,从而得到所述第二字段集对应的证件类型所属的数字序列;
将所述数字序列按照字段的预设顺序进行排序,从而得到所述第二字段集对应的所述证件类型的向量;
将多个所述证件类型各自的向量组成集合以生成向量集;
所述判断预设的向量集中是否存在与所述证件图像的向量相匹配的向量的步骤包括:
计算所述证件图像的向量与所述向量集中包含的每个向量的余弦相似度;
判断是否存在余弦相似度不小于预设余弦相似度阈值的向量;
若存在余弦相似度不小于预设余弦相似度阈值的向量,判定所述向量集中存在与所述证件图像的向量相匹配的向量。
2.根据权利要求1所述证件图像分类方法,其特征在于,所述得到所述第二字段集对应的证件类型所属的数字序列的步骤之后,还包括:
根据所述第二字段集中每个所述字段出现的次数,按照第三预设方式配置权重至所述第二字段集对应的所述数字序列中每个所述字段对应的数字。
3.根据权利要求2所述证件图像分类方法,其特征在于,所述字段对应的数字配置的权重与每个所述字段出现的次数成反比。
4.根据权利要求1-3任一项所述证件图像分类方法,其特征在于,所述若所述向量集中存在与所述证件图像的向量相匹配的向量,将与所述证件图像的向量相匹配的向量作为目标向量,并根据所述目标向量对应的证件类型确定所述证件图像的证件类型的步骤包括:
若所述向量集中存在与所述证件图像的向量相匹配的向量,将与所述证件图像的向量相匹配的向量作为目标向量;
若所述目标向量的数量为一个,将所述目标向量对应的证件类型确定为所述证件图像的证件类型;
若所述目标向量的数量为多个,将多个所述目标向量中与所述证件图像的向量最接近的目标向量对应的证据类型确定为所述证件图像的证件类型。
5.根据权利要求1所述证件图像分类方法,其特征在于,所述基于OCR模型提取所述证件图像中包含的所有字段的步骤之前,还包括:
通过预设证件识别模型对所述证件图像进行识别;
判断通过所述预设证件识别模型是否能够确定所述证件图像所属的证件类型;
若通过所述预设证件识别模型未能确定所述证件图像所属的证件类型,执行所述基于OCR模型提取所述证件图像中包含的所有字段的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910979547.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序