[发明专利]一种基于模型融合的OCR识别方法在审
申请号: | 202010325757.3 | 申请日: | 2020-04-23 |
公开(公告)号: | CN111611985A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 张昊;傅枧根 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 邓建辉 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 融合 ocr 识别 方法 | ||
本发明提供了一种基于模型融合的OCR识别方法,该方法采用若干识别模型搭建深度学习神经网络模型,所述识别模型分别对字符定位数据进行训练,至模型收敛后得到预输出识别结果,将所述预输出识别结果融合优化后输出最终识别结果。解决了多模型融合的OCR识别问题,相比传统的OCR识别方法,采用深度学习的多模型融合的OCR识别技术,不仅定位精准,而且识别的准确率高,模型识别效果更稳定。
技术领域
本发明属于图像文字处理技术领域,具体涉及一种基于模型融合的OCR识别方法。
背景技术
随着社会经济的快速发展,人们每天产生大量图片形式的数据,包括被扫描的身份证、自动拍摄的车牌照片、电子形式的发票,扫描形式的文件等等,将这些图片里面的字符信息自动转化为文本形式的过程,即称为光学字符识别(Optical CharacterRecognition,简称OCR)。在传统的OCR识别过程中,一般的流程是人工收集数据、人工录入数据、人工校验,但是整个流程下来,不仅耗费人工周期较长,而且容易出现人工数据录入错误。针对这种情况,急需一种高效且快速的OCR识别方法。
OCR已运用到各种领域,如常见的车牌识别系统,ID卡识别系统,发票识别系统等。一个OCR系统按功能需求至少包括图像预处理、字符定位切割和字符识别。OCR应用于不同的领域,对模块性能的要求不相同。如车牌识别系统,需采用摄像头对车辆图像进行采集,周围环境如光照等容易对车牌的识别效果造成影响,因此,车牌系统对预处理模块的要求很高。而对于ID卡识别系统、发票识别系统等,其输入的图像大都采用高拍仪、扫描仪等设备,扫描图像清晰、干扰小,所以对预处理模块的要求较低。而文献的版面内容比车牌更为复杂,需要考虑识别算法的快速性。因此针对不同的研究对象,OCR识别系统的设计都需要对其各个系统模块做算法的研究,寻找最契合的方案。
针对日益增加的OCR识别需求以及日益多样化和复杂化的图片数据。目前基于深度学习的OCR识别方法主要包含两个步骤:定位出要识别的字符区域,识别出该区域的字符内容。在传统的OCR识别方法中,通常采用图像处理技术来进行待识别区域的定位出逐个字符,但是当图片比较复杂时定位会出现很大偏差,所以导致后面的识别的准确率很低。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于模型融合的OCR识别方法。
根据本发明第一方面实施方式的一种基于模型融合的OCR识别方法,采用若干识别模型搭建深度学习神经网络模型,所述识别模型分别对字符定位数据进行训练,至模型收敛后得到预输出识别结果,将所述预输出识别结果融合优化后输出最终识别结果。
根据本发明的一些实施方式,包括以下步骤:
获得经过数据集预处理的识别模型和字符定位数据;
获得基于所述识别模型的深度学习神经网络模型;
获得预输出识别结果,所述预输出识别结果通过将所述字符定位数据输入所述深度学习神经网络模型进行训练后得到;
获得最终识别结果,所述最终识别结果由所述预输出识别结果经过融合优化后得到。
根据本发明的一些实施方式,所述数据集包括训练集、验证集和测试集。
根据本发明的一些实施方式,所述训练集、验证集和测试集的比例为4:1:1。
数据集预处理的识别模型,指用数据集对识别模型进行预处理。首先,将数据集按照4:1:1分为训练集、验证集和测试集,其次,对数据集进行预处理以增强模型的泛化能力。
其中,数据集可以选用但不局限于开源的ICDAR2017,其只含有英文字符,约16000张图片。还可以是超市发票图片,手机拍照上传的发票单据图片,收费站拍照汽车牌照图片等,即凡是含有文字的各种图片都属于OCR识别的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010325757.3/2.html,转载请声明来源钻瓜专利网。