[发明专利]一种文本图像倾斜角度的检测方法及装置有效
申请号: | 202011095925.0 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112287927B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭从洲;李可;朱奕坤;童晓冲;李贺;魏鑫;王习文;张锦添;雷毅 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/24;G06V10/764 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 张倩;朱文杰 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 倾斜 角度 检测 方法 装置 | ||
本说明书实施例提供了文本图像倾斜角度的检测方法及装置,通过预先训练好包含一阶段二分类网络模型和多阶段多分类网络模型的深度神经网络模型集合,在获取到目标文本图像信息后,结合该目标文本图像信息对应的倾斜角度用途标注信息,确定对应的目标神经网络模型,再利用该目标神经网络模型识别得到目标文本图像信息的图像倾斜角度数据,这样能够提高图像倾斜角度的确定准确率,提高图像倾斜角度的识别效率,提升了图像倾斜角度的参考价值,以便作为后续文本图像处理的关键依据;另外,针对多阶段多分类网络模型,通过对目标文本图像信息执行多次倾斜角度类别识别,实现由大角度区间类别到小角度区间类别逐层细化确定最终的图像倾斜角度数据。
技术领域
本文件涉及文本图像倾斜角度的检测领域,尤其涉及一种文本图像倾斜角度的检测方法及装置。
背景技术
目前,光学字符识别(Optical Character Recognition,OCR)是指对文本图像进行处理,获取文字及版面信息的过程,也是光学理论实践应用的一个重要研究方向。不论是传统意义上OCR技术还是基于深度学习的OCR技术,均需要获得更高的文字识别精度和准确率。
随着深度学习技术的发展,人们在文字识别方法上取得了很大的进步,已经将文本检测和文本识别集成到了一个模型中。从单一的水平直线文字行到现在的各类曲线文字行都能有很好的识别结果。然而,文字识别过程中要求单个文字方向要保持大致上的“正立”,如果出现“倒立”的文字,识别准确率就会变得很低,可见文字识别准确率除了与识别方法有关以外,还与文本图像中文字的倾斜方向和角度也密切相关。
其中,常见的文本倾斜角度方法主要有投影法、Hough变换法、K-最近邻簇法、Fourier变换法及其变种方法。这些方法的基本原理都是先检测文本图像中的直线特征,利用直线的斜率来确定文本图像的倾斜角度,然后再进行倾斜校正。这些检测方法均需要文本图像中一定要有直线特征或类似于直线的特征,人们常常对文本图像进行游长平滑及细化处理来获取文本行直线。由于直线的倾斜角度范围是在±90°之间,而文本图像的倾斜角度范围是在±180°之间,因此,当文本图像旋转180°成为倒立图像时,利用常规的倾斜角度检测方法无法得到准确度倾斜角度。也就是说,当文本图像倾斜角度大于90°或小于90°时,利用将直线的倾斜角理解为文本图像的倾斜角都是错误的。由于文本图像倾斜程度不仅与角度有关也与方向有关,而常规的直线检测法是无法检测出旋转方向的。
由此可知,需要一种不依赖直线特征的、更加普适的、准确度更高地文本图像倾斜角度检测的方法。
发明内容
本说明书一个或多个实施例的目的是提供一种文本图像倾斜角度的检测方法。该文本图像倾斜角度的检测方法包括:
获取待检测的目标文本图像信息;
基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。
本说明书一个或多个实施例的目的是提供一种文本图像倾斜角度的检测装置。该文本图像倾斜角度的检测装置包括:
文本图像获取模块,用于获取待检测的目标文本图像信息;
目标网络选取模块,用于基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011095925.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序