[发明专利]一种字符切分方法和装置有效
申请号: | 200810101591.6 | 申请日: | 2008-03-07 |
公开(公告)号: | CN101251892A | 公开(公告)日: | 2008-08-27 |
发明(设计)人: | 亓文法;程道放;李晓龙;卢书一 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/68;G06K9/72 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 李娟 |
地址: | 100871北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 切分 方法 装置 | ||
1.一种字符切分方法,其特征在于,包括:
对文本图像进行行切分和列切分,获得若干个字符单元图像块;
识别包含粘连字符的字符单元图像块,并继续切分所述包含粘连字符的字符单元图像块;
识别汉字字符单元图像块区域和英文字符单元图像块区域,并在所述汉字字符单元图像块区域中识别由汉字字符偏旁部首占用的字符单元图像块;
将相邻的汉字字符的偏旁部首占用的字符单元图像块合并为一个字符单元图像块;以及
当字符单元图像块的宽度小于等于该字符单元图像块的高度,且该字符单元图像块完全在文本行中心线位置的上面或者下面时,确定字符单元图像块包含标点符号,或者当字符单元图像块的高度小于文本行的高度,宽度小于汉字字符单元图像块平均宽度的1/4,且该字符单元图像块与其相邻的前一字符单元图像块或后一字符单元图像块之间的距离值中,至少有一个距离值大于相邻中英文字符单元图像块之间距离范围的上限时,确定字符单元图像块包含标点符号。
2.如权利要求1所述的方法,其特征在于,所述粘连字符包括粘连汉字字符,以及所述识别包含粘连字符的字符单元图像块包括:
当字符单元图像块的宽度大于汉字字符单元图像块的平均宽度,且该字符单元图像块的高度与字符单元图像块的平均高度的差值小于设定的阈值时,确定字符单元图像块包含粘连汉字字符。
3.如权利要求1或2所述的方法,其特征在于,所述粘连字符包括粘连英文字符,所述识别包含粘连字符的字符单元图像块包括:
当字符单元图像块的宽度大于汉字字符单元图像块的平均宽度,且该字符单元图像块的高度与字符单元图像块的平均高度的差值大于设定的阈值时,确定字符单元图像块包含粘连英文字符。
4.如权利要求1所述的方法,其特征在于,所述识别汉字字符偏旁部首占用的字符单元图像块的方法包括:
当字符单元图像块的高度大于字符单元图像块的平均高度,宽度大于汉字字符单元图像块的平均宽度的4/5时,确定字符单元图像块包含汉字字符;
当所述汉字字符单元图像块与前一字符单元图像块之间的距离处于相邻中英文字符单元图像块之间的距离范围之外时,将前一字符作为当前字符;
当当前字符单元图像块与前一字符单元图像块中心之间的距离处于相邻汉字字符单元图像块中心之间的距离范围之外时,确定所述当前字符与前一字符均为偏旁部首字符。
5.一种字符切分装置,其特征在于,包括:
初步切分单元,用于对文本图像进行行切分和列切分,获得若干个字符单元图像块;
粘连字符切分单元,用于识别包含粘连字符的字符单元图像块,并继续切分所述包含粘连字符的字符单元图像块;
识别偏旁部首单元,用于识别汉字字符单元图像块区域和英文字符单元图像块区域,并在所述汉字字符单元图像块区域中识别由汉字字符偏旁部首占用的字符单元图像块;
字符合并单元,用于将相邻的汉字字符的偏旁部首占用的字符单元图像块合并为一个字符单元图像块;
识别标点符号单元,用于当字符单元图像块的宽度小于等于该字符单元图像块的高度,且该字符单元图像块完全在文本行中心线位置的上面或者下面时,确定字符单元图像块包含标点符号,或者当字符单元图像块的高度小于文本行的高度,宽度小于汉字字符单元图像块平均宽度的1/4,且该字符单元图像块与其相邻的前一字符单元图像块或后一字符单元图像块之间的距离值中,至少有一个距离值大于相邻中英文字符单元图像块之间距离范围的上限时,确定字符单元图像块包含标点符号。
6.如权利要求5所述的字符切分装置,其特征在于,所述粘连字符切分单元具体用于,当字符单元图像块的宽度大于汉字字符单元图像块的平均宽度,且该字符单元图像块的高度与字符单元图像块的平均高度的差值小于设定的阈值时,确定字符单元图像块包含粘连汉字字符,或者
当字符单元图像块的宽度大于汉字字符单元图像块的平均宽度,且该字符单元图像块的高度与字符单元图像块的平均高度的差值大于设定的阈值时,确定字符单元图像块包含粘连英文字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正电子有限公司,未经北大方正集团有限公司;北京大学;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810101591.6/1.html,转载请声明来源钻瓜专利网。