[发明专利]提取满文单词图像中轴线的方法有效
申请号: | 201810371803.6 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108564078B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 郑蕊蕊;李敏;贺建军;许爽;吴宝春;卢海涛 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 满文 单词 图像 轴线 方法 | ||
提取满文单词图像中轴线的方法,属于文字切分领域,用于解决提高满文切分精度的问题,技术要点是:定位满文单词图像中轴线,检测满文单词图像中轴线宽度,效果是对于满文单词图像中轴线提取,直接影响切分的准确率,为了提供切分准确率,必要的将中轴线提取的精度被提高,因而,将中轴线定位,并检测其宽度,可以将中轴线准确提取。
技术领域
本发明属于文字切分领域,涉及一种提取满文单词图像中轴线的方法。
背景技术
满文是我国满族、锡伯族等少数民族使用的语言文字,在清代作为法定文字被推广和使用,形成了大量珍贵的满文文献。由于目前满语文已濒临消失,满族语言文化遗产亟待抢救和保护得到国家和社会各界的认同和重视。研究满文的光学字符识别技术对保护和传承清代文化遗产显得尤为重要。满文是一种音素文字,共有38个字母,其中6个元音字母,22个辅音字母,此外还有10个专门用于拼写汉语借词的特定字母。满文书写采用字序从上到下,行款从左到右的规则。对于满文识别往往需要先将满文先切分基本单元(如字母等),再予以识别,因而,提高满文识别的精度可以从提高其切分精度着手。
发明内容
为了解决提高满文切分精度的问题,本发明提出如下技术方案:
一种提取满文单词图像中轴线的方法,包括如下步骤:
S1.定位满文单词图像中轴线;
S2.检测满文单词图像中轴线宽度。
作为技术方案的补充:所述步骤S1具体包括:
S1.1.对满文单词图像取反,令文字部分的像素值取1,而背景部分的像素值取0;
S1.2.使用MATLAB图像处理工具箱的形态学细化函数实现满文单词图像的形态学细化;
S1.3.对形态学细化后的满文单词图像,使用霍夫变换以确定细化的中轴线所对应的列坐标,该列坐标作为满文单词图像中轴线的位置,其中,限定霍夫变换搜索直线的角度为θ=90,仅查找竖直方向的直线,并连接相同纵向位置的,间距小于满文单词图像高度且自身长度大于1个像素的直线为一条直线,求出中轴线的中心位置。
作为技术方案的补充:所述步骤S2具体包括:
S2.1.确定最大游程比例法的搜索区域;
S2.2.对满文单词图像在搜索区域内施以最大游程比例法而确定满文单词图像中轴线的宽度;
S2.3.由满文单词图像中轴线的中心位置和中轴线的宽度计算中轴线的左边界和右边界。
作为技术方案的补充:所述步骤S2.1具体为:
最大游程比例法的搜索区域由下述公式规定的范围所确定:
其中,sl是限定的搜索范围的左边界,sr是限定的搜索范围的右边界,baseline是中轴线的中心位置,round表示向最近的整数取整,W是满文单词图像的宽度。
作为技术方案的补充:所述步骤S2.2的最大游程比例法的步骤:扫描满文单词图像搜索区域单词图像的每一行,并统计连续黑色像素的游程长度和该长度出现的次数,则具有最大出现次数的游程长度就是满文单词图像中轴线的宽度。
作为技术方案的补充:由下式计算所述步骤S2.3的中轴线的左边界和右边界;
其中:bl是中轴线的左边界,br是中轴线的右边界,baseline是满文单词图像中轴线的中心位置,baseline_width是满文单词图像中轴线的宽度,round表示向最近的整数取整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810371803.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序