[发明专利]一种文字识别方法、装置及设备在审
申请号: | 201910681467.X | 申请日: | 2019-07-26 |
公开(公告)号: | CN110363190A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 张瀚文;张宏韬;李兆佳;曲建方 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;任默闻 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字识别 文本区域 子图像 装置及设备 文字数据 图像 机器学习模型 图像数据样本 输入文字 中文字 批注 像素 整合 反馈 | ||
本说明书实施例提供一种文字识别方法、装置及设备。所述方法包括:接收待识别图像;根据所述待识别图像中像素对应的特征值,获取文本区域子图像;将所述文本区域子图像输入文字识别模型,得到对应于所述文本区域子图像的识别文字数据;所述文字识别模型,包括基于被批注的图像数据样本训练出的机器学习模型;整合所述识别文字数据并反馈。通过上述方法,提高了图像中文字识别的准确性,简化了文字识别的步骤,从而能够快捷准确地实现文字识别。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种文字识别方法、装置及设备。
背景技术
以往,针对图像中的文字,虽然人类可以轻易地识别出其中的文字,但对于计算机来说,并不能直接地从图像中识别出文字。随着人们所接触的包含文字的图像越来越多,全部依靠人力对图像中的文字进行识别并不现实。文字识别技术也就应运而生。现有的文字识别技术大多是依据大量的数据样本训练,得到能够对文字进行识别的训练模型之后,再利用所述训练模型进行训练。
但是,利用现有技术中的所述训练模型进行文字识别时,往往需要分别利用多个阶段进行执行,实现过程较为繁琐,在对文字进行识别时,需要预先将字符串切分为单个字符,以此分别进行识别,识别完成后再将这些单个字符进行拼接整合为正常文本,使得在文字识别时的效率也较为低下。此外,针对图像扭曲、模糊的情况,往往在初始阶段就无法较好地判断出文字所在的区域,给文字识别带来了不小的困难。因此,目前亟需一种能够方便准确地实现文字识别的技术。
发明内容
本说明书实施例的目的是提供一种文字识别方法、装置及设备,以解决现有技术中在识别文字是需要对字符进行单独批注,且识别准确性不高的问题,从而实现快速准确地进行文字识别。
为了解决上述问题,本说明书实施例提出了一种文字识别方法、装置及设备,具体按照如下方式实施:
一种文字识别方法,包括:
接收待识别图像;
根据所述待识别图像中像素点对应的特征值,获取文本区域子图像;
将所述文本区域子图像作为整体输入文字识别模型,得到对应于所述文本区域子图像的识别文字数据;所述文字识别模型,包括基于被批注的图像数据样本训练出的机器学习模型;
整合所述识别文字数据并反馈。
一种文字识别装置,包括:
图像接收模块,用于接收待识别图像;
文本区域子图像获取模块,用于根据所述待识别图像中像素点对应的特征值,获取文本区域子图像;
识别文字数据获取模块,用于将所述文本区域子图像作为整体输入文字识别模型,得到对应于所述文本区域子图像的识别文字数据;所述文字识别模型,包括基于被批注的图像数据样本训练出的机器学习模型;
反馈模块,用于整合所述识别文字数据并反馈。
一种文字识别设备,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述计算机指令来实现以下步骤:接收待识别图像;根据所述待识别图像中像素点对应的特征值,获取文本区域子图像;将所述文本区域子图像作为整体输入文字识别模型,得到对应于所述文本区域子图像的识别文字数据;所述文字识别模型,包括基于被批注的图像数据样本训练出的机器学习模型;整合所述识别文字数据并反馈。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910681467.X/2.html,转载请声明来源钻瓜专利网。