[发明专利]基于笔画片段和轮廓特征的笔迹识别方法有效
申请号: | 201310225735.X | 申请日: | 2013-06-06 |
公开(公告)号: | CN103279770A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 邬向前;卜薇;唐有宝 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/46 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于笔画片段和轮廓特征的笔迹识别方法,首先需要将书写人书写的笔迹用扫描仪扫描成静态图像,然后利用图像处理技术将笔迹图像进行二值化和边缘提取得到相应的二值图像和轮廓图像,然后利用本发明提出的特征提取方法分别对二值图像和轮廓图像进行特征提取,最后利用模式识别技术对提取的特征进行身份识别。本发明提取了一种新的基于笔画片段和码书技术的特征提取方法和新的基于笔画轮廓的特征提取方法。并将两个提出的特征进行融合,进一步提高了识别精度。 | ||
搜索关键词: | 基于 笔画 片段 轮廓 特征 笔迹 识别 方法 | ||
【主权项】:
1.一种基于笔画片段和轮廓特征的笔迹识别方法,其特征在于,方法如下:(1)笔迹图像的获取要求书写人在颜色单一的纸上书写任意一段文字,然后利用扫描仪将纸上的文字扫描到电脑中,得到静态的笔迹图像;(2)笔迹图像二值化和边缘提取扫描得到的笔迹图像为灰度图像,利用大津法对原始的灰度图像进行自适应二值化处理,得到二值图像,然后根据连通体的面积将二值图像中小的连通体去除,最后利用传统的边缘检测方法提取笔迹轮廓图像;(3)笔画分割及码书构造首先对笔画进行定义,将笔迹二值图像中的每一个连通体作为一个笔画,采用不同的笔画片段在笔迹图像中出现的频率作为特征来区分每个书写人的身份,首先要进行笔迹分割过程来提取笔画片段,采用基于滑动窗口的笔迹分割方法分为以下几个步骤:3.1)获取笔迹图像中所有的连通体;3.2)对每一连通体,计算保护它的最小矩形,设该矩形的宽为WCC,高为HCC;3.3)根据最小矩形,构造一个滑动窗口,该窗口的宽为WSW=30,高为最小矩形的高HCC;3.4)在最小矩形上,以步长为Gap,从左到右的移动滑动窗口,每次滑动窗口里的都是一个片段,得到多个片段;3.5)对每一片段,将其归一化到大小为30×30,并保持原始片段中连通体的长宽比,把归一化后的片段称之为一个笔画片段,最后用一个由0和1组成的大小为900的向量来表示每一个笔画片段;利用自组织神经网络聚类算法,从训练样本的笔画片段中构造一个笔画片段的码书,码书由少数量的通用的笔画片段组成,其中每一个通用的笔画片段被称之为一个码字;(4)基于笔画片段的特征提取构造完码书之后,从笔迹图像中提取一种笔画片段直方图特征,称为SFH特征,用SF={f1,f2,...,fn}记为n个从笔迹图像中分割得到的笔画片段,并用C={c1,c2,...,cN}记为大小为N的一个笔画片段码书。SFH特征的提取过程如下:4.1)初始化大小为N的SFH特征向量,如SFH=[0,0,...,0]。4.2)对每一个笔画片段fi∈SF,计算它和每一个码字cj∈C之间的欧式距离,如下:ED ij = Σ k = 1 900 ( f ik - c jk ) 2 . ]]> 计算完之后,对每一个笔画片段fi,我们将得到一个欧式距离向量EDVi,如下:EDVi=[EDi1,EDi2,...,EDiN].4.3)对EDVi进行升序排序,并得到排序后EDVi中的钱t个元素的索引,记为:IDX={idx1,idx2,...,idxt}.4.4)对前t个元素进行指数变换和归一化过程,并得到一个响应向量RVi,计算过程如下:v ik = exp ( - delta × ED i , idx k ) ]]>SV i = Σ k = 1 t v ik ]]>rv ik = v ik SV i ]]> RVi=[rvi1,rvi2,...,rvit]其中delta是一个常数;4.5)对每一个idxk∈IDX,用如下方式更新SFH特征向量:SFH idx k = SFH idx k + rv ik . ]]> 4.6)重复步骤4.2到步骤4.5,使所有的笔画片段都被处理;4.7)计算最终的SFH特征向量,如下:SFH i = SFH i Σ j = 1 N SFH j . ]]> (5)基于轮廓的特征提取针对笔迹轮廓图像提出了一种局部轮廓模型直方图特征,简称为LCPH特征,LCPH特征提取过程需要跟踪笔迹轮廓图像中的每一个轮廓点;局部轮廓模型定义为每个轮廓点的一个n×n的邻域,n=17时,识别精度最高,因此局部轮廓模型的带下为17×17;为了能具体表述局部轮廓模型,将局部轮廓模型划分为多个大小为3×3的小块,并且在水平和垂直方向相邻的两个小块重叠一个像素。在每个小块中,用1表示轮廓点,0表示背景点,这样每个小块将会由9个由0或1组成的二进制串,因此在每个小块中存在29=512不同的情况出现;给定一个笔迹图像和局部轮廓模型的大小n×n,将有个小块,LCPH特征的提取过程如下:5.1)利用经典的边缘提取算子提取笔迹图像的轮廓,并用CP={p1,p2,...,pM}记为所有的M个轮廓点;5.2)对每一个小块Bi=[bi1,bi2,...,bi9],bik∈{0,1},1≤i≤m,初始化它相应的大小为512的直方图Hi=[0,0,...,0],因此将存在m个这样的直方图;5.3)对每一个轮廓点pj∈CP,有m个小块在它的局部轮廓模型中,并得到m个小块中所有元素的值,接着对一个小块串联块中的所有元素生成一个二进制字符串,记为:BSi=bi1bi2...bi9,并且将二进制字符串BSi转化为一个十进制数Si用来决定该小块属于哪种情况;5.4)对每个小块Bj,用如下方式更新它相应的直方图Hi:重复步骤5.3和步骤5.4,使所有的轮廓点都处理完;5.5)用如下方式归一化并串联所有的直方图Hi得到最终的LCPH特征向量:LCPH = [ H 1 M , H 2 M , . . . , H m M ] . ; ]]> (6)特征匹配和融合提取完特征之后,接下来进行特征匹配和融合,利用卡方距离来度量两个SFH特征和两个LCPH特征之间的相似度,用I1和I2记为两个笔迹图像,并且v1=(v11,v12,…,v1N)和v2=(v21,v22,…,v2N)记为它们相应的SFH特征向量,u1=(u11,u12,…,u1L)和u2=(u21,u22,…,u2L)记为它们相应的LCPH特征向量;则两个特征的相似度计算过程如下:D 1 ( v 1 , v 2 ) = Σ i = 1 N ( v 1 i - v 2 i ) 2 ( v 1 i + v 2 i ) ]]>D 2 ( u 1 , u 2 ) = Σ j = 1 L ( u 1 j - u 2 j ) 2 ( u 1 j + u 2 j ) ]]> 然后将D1和D2归一化到0和1之间;将这两个距离利用简单的加权融合方法得到一个新的距离,如下:D(I1,I2)=w×D1(v1,v2)+(1-w)×D2(u1,u2)其中0≤w≤1,最终利用这个新的距离来度量I1和I2之间的相似度,并根据相似度来进行笔迹识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310225735.X/,转载请声明来源钻瓜专利网。