[发明专利]一种图像文字识别的方法及装置在审
申请号: | 202011432247.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112418238A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王晶 | 申请(专利权)人: | 安徽吉秒科技有限公司 |
主分类号: | G06K9/42 | 分类号: | G06K9/42;G06K9/32;G06K9/62 |
代理公司: | 北京青松知识产权代理事务所(特殊普通合伙) 11384 | 代理人: | 郑青松 |
地址: | 230088 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文字 识别 方法 装置 | ||
1.一种图像文字识别的方法,其特征在于,该方法包括:
A、首先获取文字图像,并对文字图像进行缩放、归一化处理,然后读取处理后的图像并识别图像文字方向;
B、根据图像文字方向的识别结果,对文字图像进行校正;
C、对校正后的文字图像进行缩放、归一化处理,然后读取校正后的文字图像;
D、确定图像中每行文字所在的区域坐标,并确定出图像中每行文字倾斜的角度;
E、获取每行文字所在图像的区域坐标,以及对应行文字的倾斜度,在图像中截取每个区域坐标位置的图片,保存为image box,将这些生成的image box进行缩放和归一化处理,将将处理后的image box存入链表;
F、获取链表,并且识别出传入图像的文字内容,并返回识别出的文字在字典中的下标。
2.根据权利要求1所述图像文字识别的方法,其特征在于,步骤A中行文字方向识别的角度包括90°、180°、270°。
3.根据权利要求1所述图像文字识别的方法,其特征在于,步骤B会根据步骤A的结果,对文字图像进行相应的校正。
4.根据权利要求1所述图像文字识别的方法,其特征在于,步骤C中对校正后的文字图像进行缩放、归一化处理,其内容包括:
C1、将文字图像缩放成符合文件检测模型需要的shape;
C2、对图像的RGB内容进行归一化处理。
5.根据权利要求1所述图像文字识别的方法,其特征在于,还包括对文字图像分类。
6.一种图像文字识别的装置,其特征在于,所述的装置包括:图像文字方向检测模块、文字检测模块、文字识别模块,
图像文字方向检测模块
获取文字图像,并对文字图像进行缩放、归一化处理,然后读取处理后的图像并识别图像文字方向;
根据图像文字方向的识别结果,对文字图像进行校正,并且对校正后的文字图像进行缩放、归一化处理;
文字检测模块
获取处理后的文字图像,确定图像中每行文字所在的区域坐标,并确定出图像中每行文字倾斜的角度;
获取每行文字所在图像的区域坐标,以及对应行文字的倾斜度,在图像中截取每个区域坐标位置的图片,保存为image box,将这些生成的image box进行缩放和归一化处理,将将处理后的image box存入链表;
文字识别模块
获取链表,并且识别出传入图像的文字内容,并返回识别出的文字在字典中的下标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽吉秒科技有限公司,未经安徽吉秒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011432247.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序