[发明专利]一种数字图书的版面分析方法有效

专利信息
申请号: 201610584126.7 申请日: 2016-07-22
公开(公告)号: CN106096592B 公开(公告)日: 2019-05-24
发明(设计)人: 鲁伟明;刘佳卉;庄越挺;吴飞;魏宝刚 申请(专利权)人: 浙江大学
主分类号: G06K9/00 分类号: G06K9/00;G06T7/11;G06T7/13;G06T5/30;G06T5/50;G06K9/46
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静;邱启旺
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种数字图书的版面分析方法。基于区域分割的版面分析方法本质上是一种以JEPG或TIF格式存储图书的图像分割与区域分类。本发明首先利用形态学运算并结合Gabor线性滤波器的方法提取图片边缘以及过分割区域的基础合并,实现图书区域的分割,然后对分割的图像块进行区域填充及排序,重新构建阅读顺序,最后对图像区域进行特征提取,训练分类器得到各区域属性,实现图书的区域分离,提高OCR引擎的识别正确性以及图书查询的准确率。
搜索关键词: 一种 数字 图书 版面 分析 方法
【主权项】:
1.一种数字图书的版面分析方法,其特征在于,包括以下步骤:1)图书版面的区域分割:对数字图书页面进行区域分割,首先,利用形态学运算对原始图像做腐蚀、开闭、边缘检测、膨胀移除处理,得到过分割图片,过分割图片中具有较多的区域碎片,接着利用Gabor线性滤波器进行原始图像边缘的再提取,对碎片化区域进行初步合并,最后利用碎片化区域的位置信息对初步合并后的区域进行再合并;2)阅读顺序重构:对步骤1)分割后的区域进行填充,增加虚拟点以及区域之间的距离关系,设计优化问题及约束条件,得到阅读顺序;所述的阅读顺序重构具体包括以下子步骤:2.1)对已知区域进行行填充;假设在步骤1)中得到了N个区域,X={x1,x2,x3,....xN},xi表示任意一个区域,xi按照分割后区域的bottom值进行递增,通过步骤1)得到xi的区域位置,首先,令height=top–bottom,根据height的阈值初步判断区域是否为图像区域,通过判断区域的位置关系以及坐标特征,对区域进行扩充,得到xi扩充后的区域位置(left,top,right,bottom),下列两种情况,需要进行文本行扩充,假设图像区域x的坐标为(leftx,topx,rightx,bottomx),区域y的坐标为(lefty,topy,righty,bottomy)2.1.1)文本区域出现在图像区域的附近:2.1.2)相邻文本区域的扩充:bottomx<topx+12.2)近邻块的选择:根据xi区域位置,计算得到中心点的坐标从而计算得到两个区域xi和xj之间的距离:其中,若两区域之间的位置关系不满足正常阅读习惯,即满足以下两个条件中任意一个,则令distij=1.7976931348623157E308;其中,误差值根据扫描结果而定;2.3)设计优化问题如下:利用整数线性规划来构造阅读顺序使得所有区域之间的距离之和为最小,公式表示如下:得到每个覆盖所有区域的单独回路;2.4)约束条件设计,其中:设计约束如下:(1)每个区域只能与其他另一个区域相连;(2)两个区域之间不允许有双向的边;(3)考虑阅读顺序,要求两区域之间的顺序不能为左上;(4)人为构造虚拟点及起始区域,结束区域,得到约束条件:ui‑uj+nxij≤n‑1 when 1≤i!=j≤n每个可行解包含只有一条覆盖了所有区域的封闭区域序列,其中定义虚拟点到起始区域,结束区域的距离为0,虚拟点到其他区域的距离为1.7976931348623157E308;定义起始区域为bottom值最小的区域,定义结束区域为bottom值最大的区域;3)区域类型分类:提取、筛选分割区域的特征,形成可靠的特征向量,得到区域类型属性,对其中的有用区域进行存储;4)将各区域的坐标反馈给OCR引擎,从而在OCR处理分析时实现过滤功能,提高软件处理效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610584126.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top