[发明专利]一种图片文字的识别方法及其识别装置在审
申请号: | 201910567298.7 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110414519A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 彭宇翔;朱帆 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 彭家恩;彭愿洁 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本行 图片文字 图片 训练样本 变化处理 识别装置 训练样本集 神经网络 随机组合 图片输入 训练模型 预先建立 输出 应用 | ||
1.一种图片文字的识别方法,其特征在于,包括以下步骤:
获取待识别的文本行图片,所述待识别的文本行图片包含文字;
将所述待识别的文本行图片输入至预先建立的图片文字识别模型,以识别得到所述待识别的文本行图片中的文字;所述图片文字识别模型是利用多幅用于训练的文本行图片通过训练深度神经网络而得到,所述用于训练的文本行图片是由标准的文本行图片经过扩充变化处理后得到的图片;
输出所述待识别的文本行图片中的文字。
2.如权利要求1所述的识别方法,其特征在于,所述将所述待识别的文本行图片输入至预先建立的图片文字识别模型,以识别得到所述待识别的文本行图片中的文字,其中所述图片文字识别模型通过以下方式建立:
获取一幅或多幅标准的文本行图片,所述标准的文本行图片由预设的文本行二值化图片和预设的背景图片进行合成而得到;
对每幅所述标准的文本行图片进行扩充变化处理,得到对应的样本图片,根据所述样本图片形成训练样本集;
利用所述训练样本集,通过深度神经网络,训练得到所述图片文字识别模型。
3.如权利要求2所述的识别方法,其特征在于,所述获取一幅或多幅标准的文本行图片,所述标准的文本行图片由预设的文本行二值化图片和预设的背景图片进行合成而得到,包括:
根据所述待识别的文本行图片中的文字获取多个相关的文本内容,将各个文本内容分别进行不同的字体风格变化,生成对应的文本图像,根据所述文本图像形成预设的文本行二值化图片;
根据所述待识别的文本行图片确定相关的标准模板图片,从所述标准模板图片中获取无文字的背景区域,根据所述无文字的背景区域形成预设的背景图片;
对于每一个文本行二值化图片,将该文本行二值化图片与所述背景图片进行合成处理,得到一幅所述标准的文本行图片。
4.如权利要求3所述的识别方法,其特征在于,所述根据所述待识别的文本行图片中的文字获取一条或多条相关的文本内容,包括:
根据所述待识别的文本行图片中的文字获取一个或多个相关的词条,对每个词条进行拆分,组合后生成更多的词条,将生成的每一个词条按照预设的字体类型进行转换得到对应的文本内容。
5.如权利要求4所述的识别方法,其特征在于,所述对每幅所述标准的文本行图片进行扩充变化处理,得到对应的样本图片,根据所述样本图片形成训练样本集,包括:
对于每幅标准的文本行图片,将该标准的文本行图片进行透视变换、色调变换、添加阴影效果、添加高光效果、添加噪点、裁剪、缩放、压缩中的一种处理或多种处理之后,得到对应的样本图片;
整合每幅标准的文本行图片对应的样本图片以及该样本图片中的文本内容,以形成训练样本集;该样本图片中的文本内容为合成该标准的文本行图片的文本行二值化图片所对应的文本内容。
6.如权利要求5所述的识别方法,其特征在于,所述利用所述训练样本集,通过深度神经网络,训练得到所述图片文字识别模型,包括:
构建深度神经网络的网络模型;
以所述训练样本集中的每个样本图片为训练数据,以每个样本图片中的文本内容为训练数据的标签,对所述深度神经网络的网络模型进行连续训练,得到所述图片文字识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910567298.7/1.html,转载请声明来源钻瓜专利网。