[发明专利]一种图片文字的识别方法及其识别装置在审
申请号: | 201910567298.7 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110414519A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 彭宇翔;朱帆 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 彭家恩;彭愿洁 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本行 图片文字 图片 训练样本 变化处理 识别装置 训练样本集 神经网络 随机组合 图片输入 训练模型 预先建立 输出 应用 | ||
一种图片文字的识别方法及其识别装置,该识别方法包括:获取待识别的文本行图片,将待识别的文本行图片输入至预先建立的图片文字识别模型,以识别得到待识别的文本行图片中的文字,输出待识别的文本行图片中的文字;其中图片文字识别模型是利用多幅用于训练的文本行图片通过训练深度神经网络而得到,用于训练的文本行图片是由标准的文本行图片经过扩充变化处理后得到的图片。由于用于训练的文本行图片是由标准的文本行图片进行扩充变化处理而得到,使得图片文字识别模型的训练样本集更符合实际应用,相比随机组合字符而得到的训练样本,大大缩减了训练样本的数量,却大幅提高了生成训练样本和训练模型的效率。
技术领域
本发明涉及图像处理技术领域,具体涉及一种图片文字的识别方法及其识别装置。
背景技术
光学字符识别(OCR)领域一直是计算机视觉领域一个重要分支,在金融、教育等领域都有很大需求。在现有的光学字符识别方法中,有基于单字识别的情形,也有基于文本行识别的情形。其中,基于单字识别的方法由于有着难以准确切分单字和无法综合上下文的问题,致使实际应用中单字识别精度往往不如人意。此外,基于文本行识别的方法由于需要大量的高质量训练样本才能训练得一个较好的文本行识别模型,并且所需的训练样本量随着文本行的长度而增加甚至是以指数级的形式进行增加,由此致使获取高质量、大样本量的训练样本时遇到困难。
目前,文本行识别技术往往采用了深度神经网络,在训练样本充足的情况下才能有效地对文本行进行识别。然而,在现实中往往收集不到足够多的训练样本,而且通过公开数据集训练得的识别模型对特定应用场景下的识别精度不佳,以及现有的生成字符技术因对真实场景不能很好模拟也影响到文本行的识别精度。
综上所述,光学字符识别技术需要与应用场景进行紧密联系,亟需一种识别方法来解决训练样本缺乏所造成的识别模型训练效果差、文本识别精度低的问题。
发明内容
本发明主要解决的技术问题是如何克服训练样本缺乏所造成的文本识别模型训练效果差、文本识别精度低的问题。为解决上述技术问题,本申请提供一种图片文字的识别方法及其识别装置。
根据第一方面,一种实施例中提供一种图片文字的识别方法,包括以下步骤:
获取待识别的文本行图片,所述待识别的文本行图片包含文字;将所述待识别的文本行图片输入至预先建立的图片文字识别模型,以识别得到所述待识别的文本行图片中的文字;所述图片文字识别模型是利用多幅用于训练的文本行图片通过训练深度神经网络而得到,所述用于训练的文本行图片是由标准的文本行图片经过扩充变化处理后得到的图片;输出所述待识别的文本行图片中的文字。
所述将所述待识别的文本行图片输入至预先建立的图片文字识别模型,以识别得到所述待识别的文本行图片中的文字,其中所述图片文字识别模型通过以下方式建立:获取一幅或多幅标准的文本行图片,所述标准的文本行图片由预设的文本行二值化图片和预设的背景图片进行合成而得到;对每幅所述标准的文本行图片进行扩充变化处理,得到对应的样本图片,根据所述样本图片形成训练样本集;利用所述训练样本集,通过深度神经网络,训练得到所述图片文字识别模型。
所述获取一幅或多幅标准的文本行图片,所述标准的文本行图片由预设的文本行二值化图片和预设的背景图片进行合成而得到,包括:根据所述待识别的文本行图片中的文字获取多个相关的文本内容,将各个文本内容分别进行不同的字体风格变化,生成对应的文本图像,根据所述文本图像形成预设的文本行二值化图片;根据所述待识别的文本行图片确定相关的标准模板图片,从所述标准模板图片中获取无文字的背景区域,根据所述无文字的背景区域形成预设的背景图片;对于每一个文本行二值化图片,将该文本行二值化图片与所述背景图片进行合成处理,得到一幅所述标准的文本行图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910567298.7/2.html,转载请声明来源钻瓜专利网。