[发明专利]文档图像的区域分离方法、装置及存储介质在审
申请号: | 201911008335.7 | 申请日: | 2019-10-22 |
公开(公告)号: | CN112699712A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 王祺尧 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 区域 分离 方法 装置 存储 介质 | ||
本发明提供一种文档图像的区域分离方法、装置及存储介质。通过对文档图像进行预处理得到二值化图像,对二值化图像进行连通区域分析得到第一连通区域集合,根据第一连通区域集合中各连通区域的属性特征,将第一连通区域集合划分为第二连通区域集合和第三连通区域集合,其中第二连通区域集合中包括非文本元素的连通区域,第三连通区域集合中包括文本元素的连通区域,进一步根据第三连通区域集合中各连通区域的属性特征和相邻位置信息,从第三连通区域集合中确定文本元素的连通区域。上述方法可以从文本区域中提取更多的非文本元素,提高了文档图像的文本非文本分离的准确性。
技术领域
本发明涉及版面分析技术领域,尤其涉及一种文档图像的区域分离方法、装置及存储介质。
背景技术
随着电子期刊和电子图书等电子读物的推广与普及,人们将越来越多的传统纸张读物通过图文扫描仪、照相机等图像采集设备转化成数字图像,并放入网络中共享。我们将这种主要载荷文字、图片、表格等文本信息的数字图像称为文档图像。文档图像是由纸张文件衍生而来,具有内容直观,便于携带与传输等特点,因此在各个行业领域中都有着广泛的应用。
对文档图像的版面分析主要是利用计算机自动地对文档图像的版面数据进行处理和分割,识别图像版面上的文字、图片、图形及表格等区域的位置、属性。目前现有的文档图像的区域分离方法主要有以下两种:一种是逐像素判定方法,该方法主要针对图像中的每一个像素点,根据像素点的灰度值计算每一个像素点的边缘强度值,然后根据各像素点的边缘强度值确定与待处理图像对应的二值图,根据二值图和各像素点的灰度值,确定各像素点文本区域判定值,最后根据各像素点判定值判定图像的文本区域和非文本区域。另一种是基于深度学习的文本检测技术,该方法使用深度学习网络对图像中的文字进行检测,例如Faster RCNN、EAST、Textbox++等文字检测方法,然后将检测出的文本作为文本区域。
上述第一种方法基于单个像素和周边像素值进行计算,只能关注图像局部,不能把握图像的整体结构和各元素间的位置,区域分离的准确性和鲁棒性较低。上述第二种方法仅能检测出文字,无法将图片、表格中的文字与正常文档中的段落文字进行区分。
发明内容
本发明提供一种文档图像的区域分离方法、装置及存储介质,提高了文档图像的文本非文本分离的准确性。
本发明的第一方面提供一种文档图像的区域分离方法,包括:
对文档图像进行预处理,得到二值化图像;
对所述二值化图像进行连通区域分析得到第一连通区域集合;
获取并根据所述第一连通区域集合中各连通区域的属性特征,将所述第一连通区域集合划分为第二连通区域集合和第三连通区域集合;所述第二连通区域集合中包括非文本元素的连通区域,所述第三连通区域集合中包括文本元素的连通区域;
获取并根据所述第三连通区域集合中各连通区域的属性特征和相邻位置信息,从所述第三连通区域集合中确定文本元素的连通区域。
可选的,每一个所述连通区域的属性特征包括每一个所述连通区域的像素数量、像素密度、宽高比,以及嵌套在每一个所述连通区域的最小外接矩形中的其他连通区域的第一数量。
在一种可能的实现方式中,所述根据所述第一连通区域集合中各连通区域的属性特征,将所述第一连通区域集合划分为第二连通区域集合和第三连通区域集合,包括:
判断所述第一连通区域集合中各连通区域的属性特征是否满足第一非文本元素条件,将连通区域的属性特征满足第一非文本元素条件的连通区域划分到第二连通区域集合。
在一种可能的实现方式中,所述第一非文本元素条件包括以下条件的至少一项:
连通区域的像素数量小于预设像素数量;
连通区域的像素密度小于预设像素密度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911008335.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种合成溶聚丁戊橡胶的方法
- 下一篇:一种音视频采集终端
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序