[发明专利]一种图像文字识别的方法及装置在审
申请号: | 202011432247.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112418238A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王晶 | 申请(专利权)人: | 安徽吉秒科技有限公司 |
主分类号: | G06K9/42 | 分类号: | G06K9/42;G06K9/32;G06K9/62 |
代理公司: | 北京青松知识产权代理事务所(特殊普通合伙) 11384 | 代理人: | 郑青松 |
地址: | 230088 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文字 识别 方法 装置 | ||
本发明公开了一种图像文字识别的方法及装置,包括图像文字识别的方法和图像文字识别的装置,该方法中,能够检测到图像中的文字,并识别出文字的内容,然后将其以文本的方式输出,本发明相对现有技术能够更快的识别图像中的文字内容,具有很高的识别准确度。而且本发明能够支持文字方向检测,对倾斜或倒置的图像自动进行校正,增强了文字识别的适用性。图像文字识别的装置,该装置能够检测到图像中的文字,并识别出文字的内容,然后将其以文本的方式输出,而且具有很高的识别速度和识别准确度。本装置能够支持文字方向检测,对倾斜或倒置的图像自动进行校正,增强了文字识别的适用性。
技术领域
本发明涉及深度学习的技术领域,具体为一种图像文字识别的方法及装置。
背景技术
目前,目前多数图像文字识别系统只是能对一些标准的规整的图像进行文字检测和文字识别,一旦输入的文字图像与预期的不符,则会造成文字识别的准确度大幅降低,造成系统可用性不高。
有的图像文字识别系统只是简单的实现文字的检测与识别,未对要识别的图像进行分类处理,导致在处理一些特定类型的图片时,系统的准确率大大降低。
发明内容
本发明的目的在于提供一种图像文字识别的方法及装置,解决了现在密室逃脱游戏中缺少信息传递的装置的问题。
为实现上述目的,本发明提供如下技术方案:一种图像文字识别的方法,该方法包括:
A、首先获取文字图像,并对文字图像进行缩放、归一化处理,然后读取处理后的图像并识别图像文字方向;
B、根据图像文字方向的识别结果,对文字图像进行校正;
C、对校正后的文字图像进行缩放、归一化处理,然后读取校正后的文字图像;
D、确定图像中每行文字所在的区域坐标,并确定出图像中每行文字倾斜的角度;
E、获取每行文字所在图像的区域坐标,以及对应行文字的倾斜度,在图像中截取每个区域坐标位置的图片,保存为image box,将这些生成的image box进行缩放和归一化处理,将将处理后的image box存入链表;
F、获取链表,并且识别出传入图像的文字内容,并返回识别出的文字在字典中的
进一步的,步骤A中行文字方向识别的角度包括90°、180°、270°。
进一步的,步骤B会根据步骤A的结果,对文字图像进行相应的校正。
进一步的,步骤C中对校正后的文字图像进行缩放、归一化处理,其内容包括:
C1、将文字图像缩放成符合文件检测模型需要的shape;
C2、对图像的RGB内容进行归一化处理。
进一步的,还包括对文字图像分类。
一种图像文字识别的装置,所述的装置包括:图像文字方向检测模块、文字检测模块、文字识别模块,
图像文字方向检测模块
获取文字图像,并对文字图像进行缩放、归一化处理,然后读取处理后的图像并识别图像文字方向;
根据图像文字方向的识别结果,对文字图像进行校正,并且对校正后的文字图像进行缩放、归一化处理;
文字检测模块
获取处理后的文字图像,确定图像中每行文字所在的区域坐标,并确定出图像中每行文字倾斜的角度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽吉秒科技有限公司,未经安徽吉秒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011432247.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序