[发明专利]OCR训练数据生成方法、装置、计算机设备和存储介质在审
申请号: | 202110620906.3 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113361512A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 朱军;禤少茵 | 申请(专利权)人: | 广州市新文溯科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06T5/30 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 511400 广东省广州市番禺区小谷围街青蓝*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ocr 训练 数据 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种OCR训练数据生成方法、装置、计算机设备和存储介质。所述方法包括:通过获取训练语料库,获取图像参数信息,根据图像参数信息建立空白图像,提取训练语料库中预设字符串,按照预设的生成字符参数信息将提取的字符串中的字符写入空白图像中,生成初始图像,对初始图像进行图像增强处理,得到训练图像,根据训练图像生成训练OCR深度学习引擎的训练数据。本方案用于优化传真图像和扫描图像的识别,生成的训练数据中的图片具备真实传真图像或扫描图像特征,使用该训练数据进行训练后的OCR模型在进行识别传真图像和扫描图像时,识别率有着显著的提升。
技术领域
本申请涉及OCR识别技术领域,特别是涉及一种OCR训练数据生成方法、装置、计算机设备和存储介质。
背景技术
神经网络模型目前在大多数学科、领域应用上都取得比传统模型更好的精度效果,同时也具备良好的应用泛化性。目前常用的神经网络模型主要有卷积神经网络(CNN)、循环神经网络(RNN)以及tansformer网络这三种;同时正在发展的图神经网络(GNN)也在生物、化学等领域有着一定的应用。
任何的神经网络模型离不开模型训练,这需要构建相关的训练数据,并与神经网络模型进行权重训练。对于OCR模型的训练任务,需要生成固定尺寸的文本行图像,并记录各个图像对应的文本行字符;将数字图像输入至神经网络模型中,模型对输入图像数据进行预测;将输出的预测文本行字符与真实文本行字符进行计算,得到模型预测的误差值;将误差数值对模型参数进行更新。
目前常用的OCR训练图像生成方法,是使用random随机算法生成随机灰度或者彩色底色的无字符内容图像。使用opencv等数字图像处理库对图像写入随机尺度的字符图像。并结合简单的高斯滤波、仿射变化、加粗、裁剪等算法对图像进行增噪,获得训练图像。
上述使用的训练图像生成方法,是针对在自然场景下的字符识别,许多的噪声处理都是为了增加训练场景情况的复杂性。但在传统的扫描电子文档、传真文档的OCR识别任务上,所面对的是字符笔画的缺失、由于曝光度等问题造成笔画的细粗化以及传真条件下的低分辨率问题。因此目前的训练图像生成方法无法针对该情况生成相应的训练数据文件,导致目前的OCR模型在识别扫描电子文档、传真文档的识别率不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高OCR识别引擎在识别扫描、传真文档字符的准确度的OCR训练数据生成方法、装置、计算机设备和存储介质。
一种OCR训练数据生成方法,方法包括:
获取训练语料库;
获取图像参数信息,根据图像参数信息建立空白图像;
提取训练语料库中预设字符串,按照预设的生成字符参数信息将提取的字符串中的字符写入空白图像中,生成初始图像;
对初始图像进行图像增强处理,得到训练图像;
根据训练图像生成训练数据。
在其中一个实施例中,按照预设的生成字符参数信息将提取的字符串中的字符写入空白图像中,生成初始图像,包括:
根据图像参数信息获取生成字符参数信息;
从训练语料库的字符串中获取生成字符;
根据生成字符参数信息将生成字符写入空白图像,得到初始图像。
在其中一个实施例中,图像参数信息包括图像宽度;根据生成字符参数信息将字符写入空白图像,得到初始图像,包括:
从空白图像的字符起始水平位置开始,根据生成字符参数信息将生成字符写入空白图像中,直到下一个生成字符的字符起始水平位置超过图像宽度,停止写入,得到初始图像。
在其中一个实施例中,对初始图像进行图像增强处理,得到训练图像,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市新文溯科技有限公司,未经广州市新文溯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110620906.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能一体化增材制造装置
- 下一篇:一种自动剥皮装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置