[发明专利]一种基于形状匹配的汉字图像检索方法有效
申请号: | 201510441001.4 | 申请日: | 2015-07-24 |
公开(公告)号: | CN104965928B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 梁晓辉;詹华年;刘敏;袁春强;李阳;王郁菲 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/50 | 分类号: | G06F16/50 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 形状 匹配 汉字 图像 检索 方法 | ||
1.一种基于形状匹配的汉字图像检索方法,其特征在于包括以下步骤:
(1)对数据库中的所有汉字图像进行预处理,包括去噪,轮廓平滑,灰度化,单字分割,归一化;
(2)使用改进的Hu不变矩对汉字图像建立索引,在使用Hu不变矩对汉字图像进行表示中,加入边界矩描述子,并通过不同矩之间的比值Ri消除二维形状在缩放时带来的影响;同时获取汉字图像的区域、边界信息以提高汉字图像检索的精度;
(3)基于形状上下文对汉字图像建立索引,在使用形状上下文描述子对汉字图像描述时,只取汉字图像的骨架点和轮廓的角点进行采样;
(4)汉字图像检索,在使用上述方法对数据库中的汉字图像建立索引后,对输入的待查找图像进行同样的表示,分别通过两种索引方式在汉字图像数据库检索,先使用基于改进的Hu不变矩索引进行第一次检索,在结果集中再使用基于形状上下文索引进行二次检索;
所述步骤(2)采用改进的不变矩对汉字图像建立索引的步骤如下:
(1)对具有二维几何形状平移不变性、旋转不变性以及尺度不变性的Hu不变矩的引入并加以改进,Hu利用二阶和三阶中心矩构造了七个不变矩I1,I2,...,I7,在连续图像条件下可保持平移、绽放和旋转不变;
I1=η20+η02 (1)
I3=(η30+3η)2+(3η21-η03)2 (3)
I4=(η30+η12)2+(η21+η03)2 (4)
I5=(η30-η12)(η30+η12)[(η30+η12)2-3(η21+η03)2)]+(3η21-η03)(η21+η30)[3(η30+η12)2-(η21+η03)2] (5)
I6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03) (6)
I7=(3η21+η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(η30-3η12)(η21+η30)[3(η30+η12)2-η21+η03)2] (7)
式中ηuv表示(u+v)阶归一化中心矩;u,v为上述各式中的η的下标u,v=0,1,2,3;
Hu不变矩具有旋转不变性,所以通过不同矩之间的比值Ri来去除公式中的比例因子y带来的影响,这样能够消除二维形状在缩放时带来的影响,使得形状描述只和形状信息相关,而没有冗余信息的干扰;
其中,Ii表示i阶不变矩函数值式,所述步骤(3)采用形状上下文对汉字图像建立索引的步骤如下:
在对汉字图像轮廓表示中引入改进形状上下文算法,通过该算法对形状的轮廓采样点进行分区域描述;反应了二维形状轮廓点样之间的相对关系;
其中,表示当前轮廓点为中心时第k个区域的轮廓点数;≠操作表示q为落入第k个区域中的不同于pi点的轮廓上的其余点的数量,k表示在极坐标系下对二维平面空间进行划分的区域编号,pi为待描述的轮廓点,q表示不同于pi的轮廓点,bin(k)表示极坐标系中被划分的第k个区域;
公式(10)给出两个轮廓点集间各个采样点的相似度计算函数;
其中,pm是二维形状采样点集A上的点,qn是形状采样点集B上的点,A和B为两个待比较的轮廓采样点集,hk表示k区域的轮廓点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510441001.4/1.html,转载请声明来源钻瓜专利网。