[发明专利]基于opencv和深度学习的社保卡识别方法及系统在审
申请号: | 201910226476.X | 申请日: | 2019-03-25 |
公开(公告)号: | CN109886274A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 梁延灼 | 申请(专利权)人: | 山东浪潮云信息技术有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字区域 图像 社保卡 模板匹配 文字识别 矫正 预处理 图像采集模块 文字识别模块 社会保障卡 方法提取 技术构建 模板图像 提取模块 图像处理 构建 学习 图片 | ||
1.基于opencv和深度学习的社保卡识别方法,其特征在于包括:
以仅显示摆正放置的社会保障卡的图像为模板图像,通过模板匹配方法矫正待识别图像,并提取待识别图像中的文字区域;
基于深度学习技术构建并训练CRNN模型,通过训练后CRNN模型对文字区域进行文字识别。
2.根据权利要求1所述的基于opencv和深度学习的社保卡识别方法,其特征在于通过模板匹配方法矫正待识别图像,包括:
通过SURF特征提取算法分别提取模板图像和待识别图像的特征描述子;
通过最近邻匹配算法计算模板图像与待识别图像的相似特征点;
通过Homography单应性变换计算模板图像和待识别图像之间的映射矩阵,并通过映射矩阵对待识别图像进行矫正。
3.根据权利要求2所述的基于opencv和深度学习的社保卡识别方法,其特征在于通过模板匹配方法提取待识别图像中的文字区域,包括:
从模板图像中截取感兴趣的文字区域为模板区域;
通过matchTemplate模版匹配算法将模板区域与矫正后的待识别图像进行匹配,从待识别图像中选取与模板区域相似度最高的区域为文字区域。
4.根据权利要求1、2或3所述的基于opencv和深度学习的社保卡识别方法,其特征在于基于深度学习技术构建并训练CRNN模型,通过训练后CRNN模型对文字区域进行文字识别,包括:
构建CRNN模型,所述CRNN模型包括卷积层、循环层和转录层;
以具有文字的图像数据集为训练样本,通过训练样本对构建的CRNN模型进行训练,得到训练后CRNN模型;
通过训练后CRNN模型对文字区域进行文字识别。
5.根据权利要求1、2或3所述的基于opencv和深度学习的社保卡识别方法,其特征在于通过模板匹配方法矫正待识别图像之前,对选取的待识别图像进行图像预处理,用于消除因光照和/或拍摄角度形成的干扰。
6.根据权利要求5所述的基于opencv和深度学习的社保卡识别方法,其特征在于对待识别图像进行预处理包括:
对待识别图像进行滤波处理;
对待识别图像进行二值化处理。
7.基于opencv和深度学习的社保卡识别系统,其特征在于包括:
图像采集模块,用于获取模板图像和待识别图像,并对待识别图像进行预处理;
矫正模块,用于从图像采集模块获取模板图像和待识别图像,并通过模板匹配方法矫正待识别图像;
文字区域提取模块,用于获取矫正后待识别图像以及从模板图像中截取模板区域,并用于通过模板匹配方法提取待识别图像中的文字区域;
文字识别模块,用于基于深度学习技术构建并训练CRNN模型,并用于通过训练后CRNN模型对文字区域进行文字识别,所述CRNN模型包括卷积层、循环层和转录层;
所述模板图像为仅显示摆正放置的社会保障卡的图像。
8.根据权利要求7所述的基于opencv和深度学习的社保卡识别系统,其特征在于矫正模块通过其模板匹配子模块矫正待识别图像,模板匹配子模块为具有如下功能的子模块:
通过SURF特征提取算法分别提取模板图像和待识别图像的特征描述子;
通过最近邻匹配算法计算模板图像与待识别图像的相似特征点;
通过Homography单应性变换计算模板图像和待识别图像之间的映射矩阵,并通过映射矩阵对待识别图像进行矫正。
9.根据权利要求7或8所述的基于opencv和深度学习的社保卡识别系统,其特征在于文字区域提取模块为具有如下功能的模块:
从矫正模块获取模板图像和矫正后待识别图像,并从模板图像中截取感兴趣的文字区域为模板区域;
通过matchTemplate模版匹配算法将模板区域与矫正后的待识别图像进行匹配,从待识别图像中选取与模板区域相似度最高的区域为文字区域。
10.根据权利要求7所述的基于opencv和深度学习的社保卡识别系统,其特征在于文字识别模块为具有如下功能的模块:
构建CRNN模型,所述CRNN模型包括卷积层、循环层和转录层;
以具有文字的图像数据集为训练样本,通过训练样本对构建的CRNN模型进行训练,得到训练后CRNN模型;
通过训练后CRNN模型对文字区域进行文字识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云信息技术有限公司,未经山东浪潮云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910226476.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序