[发明专利]一种字符分割方法和装置在审
申请号: | 201710312140.6 | 申请日: | 2017-05-05 |
公开(公告)号: | CN108805128A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 李俊玲 | 申请(专利权)人: | 北京京东金融科技控股有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 赵静;蒋宇星 |
地址: | 101111 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单个字符 预分割 字符分割 分割点 集合 垂直方向投影 方法和装置 空白间隔 字符图像 遍历 分割 宽度计算 投影图像 粘连字符 字符识别 像素点 中间点 准确率 切割 查找 | ||
1.一种字符分割方法,其特征在于,包括:
将待分割字符图像进行垂直方向投影,以及从投影图像中查找空白间隔的中间点作为预分割点,从而得到预分割点集合;所述空白间隔为垂直方向投影值小于设定值的点;
根据字符总数和字符总宽度计算单个字符的平均宽度;
遍历所述预分割点集合,计算相邻两个预分割点的间隔,以及结合所述单个字符的平均宽度确定实际分割点集合;
遍历所述实际分割点集合,确定相邻实际分割点之间的像素点,从而得到所述待分割字符图像的分割后的单个字符图。
2.根据权利要求1所述的方法,其特征在于,从投影图像中查找空白间隔的中间点作为预分割点,从而得到预分割点集合的步骤包括:
从所述投影图像中查找投影值小于设定值的点,并依次记录下每一个点的横坐标;
根据相邻两个点的横坐标,依次计算相邻两个点的中间点的横坐标,从而得到预分割点坐标集blank_point={b0,b1,...,bi,..,bm};其中,m表示预分割点的总数;小于等于字符总数Nchar;bi表示第i个预分割点的横坐标。
3.根据权利要求1所述的方法,其特征在于,根据字符总数和字符总宽度计算单个字符的平均宽度的步骤包括:
根据如下公式计算单个字符的平均宽度,单个字符的平均宽度=字符总宽度/字符总数。
4.根据权利要求1所述的方法,其特征在于,遍历所述预分割点集合,计算相邻两个预分割点的间隔,以及结合所述单个字符的平均宽度确定实际分割点集合的步骤包括:
遍历预分割点集合blank_point,然后分别计算相邻两个预分割点的横坐标之间的间隔interval;
其中,interval=blank_point[i+1]-blank_point[i],i∈[0,m);
比较interval和单个字符的平均宽度W的大小,按照预设的识别规则确定实际分割点的横坐标,并将实际分割点的写入实际分割点集合segment_point;其中,b0为实际分割点集合中第一个实际分割点的横坐标。
5.根据权利要求4所述的方法,其特征在于,比较interval和W的大小,按照预设的识别规则确定实际分割点的步骤包括:
当第一系数*W<interval≤第二系数*W,则确定该间隔包含一个字符,即blank_point[i+1]为实际分割点;其中,第二系数大于第一系数。
6.根据权利要求4所述的方法,其特征在于,比较interval和W的大小,按照预设的识别规则确定实际分割点的步骤包括:
当第二系数*W<interval≤第三系数*W时,其中,第三系数大于第二系数,确定此间隔包含3个粘连字符,计算出该间隔区间内字符的平均宽度w,以blank_point[i]作为起始点start,通过如下步骤确定实际分割点:
步骤A:根据如下公式计算出所述间隔区间内的第一个粘连分割点的横坐标seg_point,seg_point=start+w,再以该第一粘连分割点为中心,向左右两边分别扩展第一预设个数的像素,在扩展后的范围内查找投影值最小的点,并将投影值最小的点作为该间隔区间内的第一实际分割点,并根据该间隔区间内的第一实际分割点的横坐标更新seg_point值;
步骤B:将步骤A中更新后的seg_point值作为起始点start,重复执行步骤A,从而得到该间隔区间内的第二个实际分割点;
步骤C:将blank_point[i+1]作为最后该间隔区间内的最后一个实际分割点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东金融科技控股有限公司,未经北京京东金融科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710312140.6/1.html,转载请声明来源钻瓜专利网。