[发明专利]一种文本图像拍摄完整度判断方法及系统在审
申请号: | 201910733241.X | 申请日: | 2019-08-02 |
公开(公告)号: | CN110472550A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 严京旗;张成栋;钱之越;郭利敏;戴文静 | 申请(专利权)人: | 南通使爱智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/38;G06T5/00;G06T7/13;G06T7/136 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字区域 贴边 二值图像 完整度 图像 图像二值化 计算参数 判断结果 文本图像 行列排布 计算量 易识别 拍摄 | ||
本发明公开了一种文本图像拍摄完整度判断方法及系统,该方案包括:对待判别图像进行图像二值化,得到二值图像;识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。本发明整个过程涉及的计算参数少,且参数简单易识别,使本发明具有计算量小、准确性高的特点。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种文本图像拍摄完整度判断方法及系统。
背景技术
办公自动化趋势显著,而绝大多数的字符识别算法对文档图像的降质十分敏感,文档图像主要呈现三种降质形式:倾斜、清晰度、扭曲。在大批量的文本图像处理中首先需要对文本图像质量进行检测,给后续图像处理提供依据或减小不必要的资源消耗是必要的。
研究领域对于倾斜、扭曲和矫正方法研究的文章较多,场景图像清晰度的检测的研究较多。在实际应用中,除了三种主要降质形式,还存在其它情况,如文本图片可能存在文字过于贴边,导致内容不全的现象。因此,如何将判断文本图像是否完整成为本领域亟待解决的问题。
发明内容
本发明的目的是提供一种文本图像拍摄完整度判断方法及系统,以解决上述问题。
为实现上述目的,本发明提供了一种文本图像拍摄完整度判断方法,所述方法包括:
对待判别图像进行图像二值化,得到二值图像;
识别所述二值图像中的文字区域,所述文字区域的呈行列排布的多个文字区域;
判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度。
可选的,所述对待判别图像进行图像二值化,得到二值图像,具体包括:
选取不同边缘阈值,根据边缘像素数目设定值提取所述待判别图像的边缘,得到边缘图像;
根据区域阈值去除所述边缘图像中面积连通区域,得到滤噪图像;
将所述滤噪图像与所述边缘图像进行边缘信息比较,修正所述滤噪图像的边缘信息,得到修正图像;
利用OTSU算法对所述修正图像进行局部二值化处理,得到初始二值图像;
滤除所述初始二值图像中的线条噪声和面积连通区域,得到滤噪二值图像;
将所述滤噪二值图像与所述修正图像对比,修正所述滤噪二值图像的边缘,得到保留文字区域的二值图像。
可选的,所述识别所述二值图像中的文字区域,具体包括:
滤除所述二值图像中的孤立点噪声,并分别按行和列的方向分段检测滤除所述二值图像中的非边缘点,得到按行和列的方向排列的分段区域;
将所有所述分段区域中的文字区域连接,得到文字区域连接图像;
利用轮廓信息对所述文字区域连接图像定位轮廓区域;
根据文字特征和所述轮廓区域识别所述文字区域连接图像中的文字区域,得到按行和列的方向排列多个文字区域。
可选的,所述判断每一所述文字区域中是否存在贴边现象,并根据每一所述文字区域的贴边判断结果确定待判别图像的完整度,具体包括:
按照逐行逐区块顺序,判断每一所述文字区域是否满足文本区域尺寸特征,得到尺寸判断结果;所述文本区域尺寸特征为高度和长宽的比值预设区间;
当所述尺寸判断结果表示是时,判断所述文字区域是否满足贴边条件,得到贴边判断结果;所述贴边条件为所述文字区域的四个顶点的阈值范围;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通使爱智能科技有限公司,未经南通使爱智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910733241.X/2.html,转载请声明来源钻瓜专利网。