[发明专利]一种藏文古籍文档的行切分方法及系统有效
申请号: | 201711206538.8 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107944451B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 王维兰;周枫明 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/38;G06T5/00;G06T7/12;G06T7/187 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王戈 |
地址: | 730000 甘肃省兰州市*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 藏文 古籍 文档 切分 方法 系统 | ||
1.一种藏文古籍文档的行切分方法,其特征在于,所述方法包括:
获取藏文古籍文档版面处理后的二值图像;
获取所述二值图像中文字区域每个连通域的重心坐标,生成坐标集合;一个所述连通域为所述二值图像中一个连通的字符笔划;
获取所述坐标集合中同一行中第i个重心坐标和第i+1个重心坐标的纵坐标的差值;其中i≥1,每一行包括多个所述连通域;
判断所述差值是否小于设定阈值,得到第一判断结果;
当所述第一判断结果表示所述差值小于设定阈值时,连接所述第i个重心坐标和第i+1个重心坐标,得到行连通域;所述行连通域上包括多个所述连通域和所述连通域的重心坐标;
获得所述行连通域的轮廓曲线;
根据所述轮廓曲线,将所述二值图像中对应的像素映射至空白图像中,得到行切分后的图像。
2.根据权利要求1所述的方法,其特征在于,所述获取所述二值图像中文字区域每个连通域的重心坐标,生成坐标集合,具体包括:
对于第s行的第i个连通域,获得所述第i个连通域的轮廓;
利用公式获得所述轮廓的水平矩m10;其中I(x,y)表示所述第i个连通域的图像中的像素点,x为所述像素点的横坐标,y为所述像素点的纵坐标;M表示x纬度的最大取值,N表示y纬度的最大取值;
利用公式获得所述轮廓的垂直矩m01;
利用公式获得所述轮廓的面积m00;
利用公式确定所述轮廓的重心的横坐标xi,s和纵坐标yi,s,得到所述第i个连通域的重心坐标(xi,s,yi,s);
依次获得所有连通域的重心坐标,生成坐标集合。
3.根据权利要求1所述的方法,其特征在于,所述当所述第一判断结果表示所述差值小于设定阈值时,连接所述第i个重心坐标和第i+1个重心坐标,得到行连通域之后,还包括:
获得所述坐标集合中不在所述行连通域上的重心坐标对应的孤立点;
获取所述孤立点到所述行连通域上的重心坐标的距离值;
将最小距离值对应的重心坐标与所述孤立点连接,获得更新后的行连通域。
4.根据权利要求1所述的方法,其特征在于,所述获得所述行连通域的轮廓曲线,具体包括:
确定所述二值图像的背景区域像素值为0,所述行连通域的像素值为1;
依次遍历所述二值图像中的像素点,获得所述二值图像的第k个像素点(x,y);
当所述第k个像素点(x,y)的像素值为1,且所述第k个像素点(x,y)的左邻域(x-1,y)、右邻域(x+1,y)的像素值分别为0、1时,在所述二值图像中标记与所述第k个像素点(x,y)坐标对应的像素点;
当所述第k个像素点(x,y)的像素值为1,且所述第k个像素点(x,y)的上邻域(x,y+1)、左邻域(x-1,y)的像素值分别为0、1,或者所述第k个像素点(x,y)的上邻域(x,y+1)、右邻域(x+1,y)像素灰度值分别为0、1,或者所述第k个像素点(x,y)的上邻域(x,y+1)灰度值为1时,在所述二值图像中标记与所述第k个像素点(x,y)坐标对应的像素点;
当所述第k个像素点(x,y)的像素值为1,且所述第k个像素点(x,y)的右邻域(x+1,y)、左邻域(x-1,y)的像素值分别为0、1时,在所述二值图像中标记与所述第k个像素点(x,y)坐标对应的像素点;
当所述第k个像素点(x,y)的像素值为1,且所述第k个像素点(x,y)的下邻域(x,y-1)、上邻域(x,y+1)像素值分别为0、1,或者所述第k个像素点(x,y)的左邻域(x-1,y)像素灰度值为1,或者所述第k个像素点(x,y)的右邻域(x+1,y)像素灰度值为1时,在所述二值图像中标记与所述第k个像素点(x,y)坐标对应的像素点;
连接所有被标记的像素点获得所述行连通域在所述二值图像中的轮廓曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711206538.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌识别方法及装置
- 下一篇:一种圆形印章文字识别方法