[发明专利]一种文字图像特征差异的快速计算方法有效
申请号: | 201310331596.9 | 申请日: | 2013-08-01 |
公开(公告)号: | CN103440472A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 宋永红;张元林;雍旭东;孟泉;刘跃虎;陈晓 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 图像 特征 差异 快速 计算方法 | ||
1.一种文字图像特征差异的快速计算方法,其特征在于,包括以下操作:
1)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对;
2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤:
首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分;
在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展;
模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少;
3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。
2.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述的四个特征的提取方法为:
前景像素个数,前景像素反映文字图像文字块的点阵分布,对于不同字号以及不同字形,前景像素的个数不同;
文字大小,文字的长度和宽度是对文字大小最直接的刻画,如果两个文字在长度或者宽度上差异明显,则直接将其滤除;
长宽比,长宽比从整体上对文字形状进行刻画;
占空比,占空比描述文字内部形状,为在二维图像中定义为前景像素在文字块中所占的比例,基于前景像素总数及文字大小,占空比通过下式得到:
Drat=S/(W×H)
其中,S为前景像素总数,W为文字图像块的宽度,H为文字图像块的高度。
3.如权利要求1或2所述的文字图像特征差异的快速计算方法,其特征在于,通过占空比对相同语种下占空比差异较大的文字对进行剔除,同时也保证了对多语种文字对的可区分性。
4.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述剔除一部分差异显著的文字配对的方法为:
对于待比较的两个文字图像块,分别提取二者的前景像素个数、文字大小、长宽比以及占空比四个特征,选取数值较小的描述子作为1,较大的描述子作为2,并通过式(3)中的判断条件决定两个文字图像块是否存在较大差异;如果条件满足,则认为差异较大,将该文字图像对的相似性值赋为0,反之,将其采用模板匹配方法进行处理;
|W1-W2|≥5∪|H1-H2|≥5
∪(S1/S2<thr)
∪(Arat1/Arat2<thr)
∪(Drat1/Drat2<thr) (3)
其中,H1和W1、H2和W2、S1和S2、Arat1和Arat2、Drat1和Drat2分别为指定文字图像块和候选文字图像块高度、宽度、前景像素总数、长宽比、及占空比,thr为设定的阈值。
5.如权利要求4所述的文字图像特征差异的快速计算方法,其特征在于,所述的阈值thr设定为0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310331596.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序