[发明专利]一种基于弹性HOG特征和DDTW匹配的中国书法图像检索方法有效
申请号: | 201310234803.9 | 申请日: | 2013-06-06 |
公开(公告)号: | CN103268363A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 夏勇;阳志波;王宽全;张盛平;伯彭波 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 弹性 hog 特征 ddtw 匹配 中国 书法 图像 检索 方法 | ||
技术领域
本发明属于信息处理技术领域,涉及一种中国书法图像的检索方法,尤其涉及一种基于弹性HOG特征和DDTW匹配的中国书法图像检索方法。
背景技术
中国书法是一种留传了3000年的写作艺术和宝贵的文化遗产,主要被收藏在博物馆和图书馆。他们中的大多数都具有很高的价值,但由于不能被随意的进行翻阅,所以不能被公众所熟知。为了便于查阅该类书法文档,许多机构提供了这些书法样本的扫描版本,如图1所示。因此,高效的索引和检索技术是不可或缺的。中国书法非常特殊,主要具有以下几个方面的特性:
1)变化:书法是用毛笔和墨水写的,从而导致其比用钢笔或铅笔写的字有更大的笔迹粗细变化。书法在不同的朝代有不同的写作风格,它们中的大多数现在已经不被采用了。
2)退化:书法样本常常由于墨水褪色、纸张污染和其他不利的自然因素而退化,以至于无法辨识。
3)形变:书法体现了书法家的个性,书法家往往故意以一种不寻常的方式书写文字,如飞白。
对于文档图像,一种传统的文字检索方法就是先对文档图像进行字符识别,然后基于识别的结果进行检索。但对于书法文档图像而言,由于书法文字的书写非常随意,并且还可能存在各种形式的图像退化,所以字符识别率很低,难以基于识别构建高效的检索系统。一种可行的方法就是不对字符图像进行显式的识别,而是直接从书法字符中提取特征,然后基于特征进行匹配。该方法可以免去繁琐且复杂的字符训练与识别过程,使得检索系统的构建简单且高效。该方法的两个关键技术就是如何提取有效特征及如何进行特征间的匹配。现有的针对手写汉字检索的特征提取方法并不能很好的直接应用于书法图像的检索中,且特征匹配方法一般都采用了DTW的动态匹配方法,但该方法性能也很有限。
发明内容
针对中国书法图像的检索问题,本发明提出了一种新的基于弹性网格和局部梯度直方图特征合成的特征提取方法,即EHOG特征;然后基于DDTW匹配方法对字符特征进行在线匹配。
本发明的基于弹性HOG特征和DDTW匹配的中国书法图像检索方法步骤如下:
(1)针对中国书法图像,先进行预处理操作,以得到单个字符图像;
(2)采用弹性网格技术,根据图像文字的像素密度分布,将输入图像划分为不同大小的网格块;
(3)在每个网格块内计算方向梯度直方图HOG特征;
(4)将每个网格块内的HOG特征进行串行连接就得到了整个字符图像的EHOG特征;
(5)将字符图像特征作为字符标引结果存入数据库;
(6)在检索时,对输入的字符图像提取EHOG特征,然后基于DDTW匹配算法,在标引数据库中进行匹配查找,基于一个特定的相似度阈值返回检索结果。
本发明采用导数动态时间规整(DDTW)算法进行文字定位,由于DDTW利用了匹配序列的形状特征,因此它能更好地应用在书法字检索的任务中,带来了更高的检索准确率。
本发明的一个显著特点就是针对中国书法图像,完全抛弃字符识别技术(OCR),直接利用字符图像的特征,创新性地将弹性网格技术和传统的HOG特征结合,提出了更适合于中国书法汉字检索的一种新型特征--弹性局部方向梯度直方图(EHOG),并且利用语音识别中比较常用的DDTW匹配算法来完成文字的检索。本发明提出的直接基于图像内容的检索方法,无需利用OCR,拥有较高的准确率、很好的鲁棒性,并且有方法简单、成本低廉等优点。
附图说明
图1为图像格式中国书法文档示例;
图2为EHOG特征提取流程图;
图3为方向为q(x,y)的双线性插值示意图(12个方向柱);
图4为EHOG特征提取方法示例;
图5为以“之”作为查询字符的部分检索结果。
具体实施方式
具体实施方式一:本实施方式的基于弹性HOG特征和DDTW匹配的中国书法图像检索方法,步骤如下:
(1)针对中国书法图像,先进行去除人工印章、消除噪声、字符分割等预处理操作,以得到单个字符图像。
(2)采用弹性网格技术,根据图像文字的像素密度分布,将输入图像划分为不同大小的网格块。
(3)定义网格基元,即其尺寸大小为小于一个网格块单元的网格单元,最小的网格基元的尺寸大小为宽度和高度均为1个像素。网格基元的大小可以由用户自行设定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310234803.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于影响矩阵的桥梁实时荷载识别方法
- 下一篇:技术信息获取方法