[发明专利]基于联合学习的卡片识别装置及方法有效
申请号: | 202110196711.0 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112883953B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 张雷;杜姗;蔡为彬;罗樋 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/18;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 联合 学习 卡片 识别 装置 方法 | ||
一种基于联合学习的卡片识别装置及方法,适用于大数据处理领域,可用于金融领域和其他领域,所述装置包含:图像扫描模块、数据预处理模块、模型生成模块和结果输出模块;图像扫描模块用于采集预定卡片的电子影像数据;数据预处理模块用于根据预设标注规则对电子影像数据中对应图像区域进行标注生成训练图像数据;模型生成模块用于提取训练图像数据中的图像噪声的结构信息和视觉信息;通过预设的神经网络模型中嵌入层分析结构信息和视觉信息,获得图像特征、语义特征、文本向量特征和位置特征;利用上述特征训练神经网络模型获得卡片识别模型;结果输出模块用于通过卡片识别模型分析待识别卡片的电子影像数据获得识别结果。
技术领域
本发明涉及人工智能领域,可应用于金融领域和图像识别领域,尤指一种基于联合学习的卡片识别装置及方法。
背景技术
目前在银行业,卡片已经得到广泛的使用,覆盖到银行业务的各个分支。卡片的定义,不仅仅局限在客户用以转账结算、存取现金的银行卡,还包含业务人员在营销工作中所使用的名片这类交际工具上。然而,不论是客户的银行卡还是其他业务人员交际应酬所用的名片,都极容易收到污渍、磨损的侵扰,对外在不利因素的抵抗力极弱。长此以往,不仅提高了银行的制卡成本,同时也会降低卡片影像识别的质量,进而影响银行后续模型的应用效果和场景落地,为银行带来潜在的剩余损害和利益损失。
为了解决这类问题,已有不少专家学者专注于解决图像的噪声问题,并提出了许多优秀的解决方案,例如:高斯滤波、中值滤波,但传统的去噪方法往往具有较大的局限性,只适配解决特定类别的图像噪声,这些方法虽然能够针对特定类别噪声带来一定程度的性能提升,但通用性不尽如人意。由于深度学习在图像识别领域取得了较好的成果,近年来,基于深度学习的图像去噪方法也被提出并得到了发展,例如卷积神经网络、多层感知机等等,但是该类模型没能很好的利用图像噪声的视觉信息和结构信息去辅助进行图像噪声的识别,导致图像识别的准确率仍有较大的提升空间。
发明内容
本发明目的在于提供一种基于联合学习的卡片识别装置及方法,针对传统数字图像处理去噪方法场景局限性、使图像产生模糊等缺陷,克服现有图像噪声识别算法的不足。
为达上述目的,本发明所提供的基于联合学习的卡片识别装置,所述装置包含:图像扫描模块、数据预处理模块、模型生成模块和结果输出模块;所述图像扫描模块用于采集预定卡片的电子影像数据;所述数据预处理模块用于根据预设标注规则对所述电子影像数据中对应图像区域进行标注生成训练图像数据;所述模型生成模块用于提取所述训练图像数据中的图像噪声的结构信息和视觉信息;通过预设的神经网络模型中嵌入层分析所述结构信息和视觉信息,获得图像特征、语义特征、文本向量特征和位置特征;利用所述图像特征、所述语义特征、所述文本向量特征和所述位置特征训练所述神经网络模型获得卡片识别模型;所述结果输出模块用于通过所述卡片识别模型分析待识别卡片的电子影像数据,获得识别结果。
在上述基于联合学习的卡片识别装置中,优选的,所述模型生成模块包含图像特征提取单元、语义特征提取单元、文本特征提取单元和位置特征提取单元;所述图像特征提取单元用于提取所述训练图像数据中文本边框内的图像信息,根据所述图像信息中噪声特征设定权值系数,通过所述权值系数筛除所述图像信息中噪声影像获得图像特征;所述语义特征提取单元用于根据所述图像信息中的文本内容,获得对应的文本语义特征;所述文本特征提取单元用于将所述文本内容分割为字符,并将每个字符转化为向量后生成文本向量特征;所述位置特征提取单元用于根据所述图像信息中文本的坐标信息生成位置特征。
在上述基于联合学习的卡片识别装置中,优选的,所述图像特征提取单元还包含:根据所述图像信息中的直观特征和属性特征获得所述噪声特征;通过计算噪声特征和图像信息中正文内容的像素矩阵差异,为噪声特征和正文内容分别设定权值系数。
在上述基于联合学习的卡片识别装置中,优选的,所述直观特征包含图像噪声的尺寸、颜色、字体、粒度、形状中一种或多种的组合;所述属性特征包含水滴型、侵染型、折损型、破损型、污染型中一种或多种的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110196711.0/2.html,转载请声明来源钻瓜专利网。