[发明专利]文档方向识别方法、装置及存储介质在审
申请号: | 201910652827.3 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110378287A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 龚星;李斌;郭双双;周易 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 文档图像 方向识别 存储介质 二值图像 图像块 图像块识别 申请 | ||
本申请公开了一种文档方向识别方法、装置及存储介质,该文档方向识别方法包括:获取文档图像,该文档图像中包括待识别文档;确定该文档图像对应的二值图像,并从该二值图像中选取多个图像块;确定每个该图像块的信息含量值;根据该信息含量值和该图像块识别该待处理文档在该文档图像中的方向,从而能快速实现对文档方向的精准识别,方法简单,识别效果好。
技术领域
本申请涉及通信技术领域,尤其涉及一种文档方向识别方法、装置及存储介质。
背景技术
文档图像文字处理的目的是在数字图像中识别文字、图形和图片,并按照需要提取信息。其中,文字处理主要包括:先进行版面分析,以切分出段落、行和单字等,然后进行OCR(Optical Character Recognition,光学字符识别)识别。
在现有OCR识别过程中,文本图像中的文本经常会出现一定角度的倾斜,比如由于扫描时用户操作不当,致使扫描图像中的文本水平倾斜了90度,而通常情况下,3度以上的倾斜会引起字符明显变形,也即这种文本倾斜现象会导致在进行OCR识别时,字符分割步骤发生困难,使OCR识别过程难以顺利完成。因此,如何快速准确的检测出倾斜文本图像的倾角,进而对倾斜的文本图像进行校正,是当今OCR识别技术在运用前的一项重要预处理技术。
发明内容
本申请实施例提供一种文档方向识别方法、装置及存储介质,能快速实现对文档方向的精准识别,准确率高。
本申请实施例提供了一种文档方向识别方法,包括:
获取文档图像,所述文档图像中包括待识别文档;
确定所述文档图像对应的二值图像,并从所述二值图像中选取多个图像块;
确定每个所述图像块的信息含量值;
根据所述信息含量值和所述图像块识别所述待处理文档在所述文档图像中的方向。
本申请实施例还提供了一种文档方向识别装置,包括:
获取模块,用于获取文档图像,所述文档图像中包括待识别文档;
第一确定模块,用于确定所述文档图像对应的二值图像,并从所述二值图像中选取多个图像块;
第二确定模块,用于确定每个所述图像块的信息含量值;
识别模块,用于根据所述信息含量值和所述图像块识别所述待处理文档在所述文档图像中的方向。
进一步地,所述第二确定模块具体包括:
第一确定子模块,用于利用已训练的全卷积网络模型确定每个所述图像块对应的热力图像;
第二确定子模块,用于确定每个所述热力图像中各像素点的第一像素值;
第三确定子模块,用于根据所述第一像素值确定对应热力图像的第一像素平均值;
第四确定子模块,用于根据所述第一像素平均值确定对应图像块的信息含量值。
进一步地,所述第四确定子模块具体用于:
确定每个所述图像块中的连通域、以及每个所述连通域的区域面积;
根据所述区域面积从所述连通域中确定目标连通域,并获取所述目标连通域的数量;
根据所述第一像素平均值、以及所述目标连通域的数量确定对应图像块的信息含量值。
进一步地,所述第四确定子模块具体用于:
根据所述第二像素值确定对应图像块的第二像素平均值;
根据所述第二像素平均值和第二像素值确定对应图像块的像素标准差值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910652827.3/2.html,转载请声明来源钻瓜专利网。