[发明专利]基于鉴别归一化的手写汉字识别方法有效
申请号: | 201210225810.8 | 申请日: | 2012-07-03 |
公开(公告)号: | CN102831434A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 朱远平;何源;孙俊 | 申请(专利权)人: | 天津师范大学;富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/20 |
代理公司: | 天津市杰盈专利代理有限公司 12207 | 代理人: | 朱红星 |
地址: | 300387 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 鉴别 归一化 手写 汉字 识别 方法 | ||
1.一种基于鉴别归一化的手写汉字识别方法,其特征在于,该方法包括训练部分和识别部分两大部分;其中,训练部分包括如下步骤:
步骤1.1 创建相似字表:在汉字字符集中寻找相似字,并构建相似字表;
步骤1.2 相似字显著性区域检测,即对相似字的不相似部分进行检测;
步骤1.3 创建归一化模型字典:将相似字表和各相似字对的显著性区域的参数信息记录在字典文件中;
步骤1.4 相似字分类器训练:每对相似字创建一个两类分类器,专门用于区分对应的两个相似字;
识别部分包括如下步骤:
步骤2.1 初始识别:用普通的手写汉字识别器对待识别字符样本进行初始识别,获得该字符样本的汉字识别候选结果;
步骤2.2 相似字搜索:搜索相似字表,找到初始识别结果的前二候选构成的字符对在相似字表中的匹配字对;
步骤2.3 字符图像变换:利用相似字间的鉴别信息对上一步骤中找到的相似字表中的匹配字对执行鉴别归一化,增加显著性区域在字符图像中所占尺寸比例;
步骤2.4 相似字识别:将在变换后的图像上进行相似字识别,只对前二候选构成的字符对中的两个字符进行识别,所用的分类器为步骤1.4中生成的相似字两类分类器。
2.根据权利要求1所述的基于鉴别归一化的手写汉字识别方法,其特征在于,相似字显著性区域检测包括如下三个步骤:
步骤1.2.1 初始字符图像归一化:采用普通的字符图像归一化方法作为预处理,提高字符图像形状分布上的紧致性;
步骤1.2.2 字符特征抽取:将每一点的字符特征用坐标点的形式进行表示;
步骤1.2.3:显著性区域分析:
显著性区域建立在不相似区域上,利用字符特征差异图发现不相似区域,
用Tm(i,j,k), Tn(i,j,k)分别表示字符Cm和Cn的特征模板,则特征差异图表示为:
(1)
令其方差为δ2,均值为;满足下面条件的分格被视为不相似分格,即
(2)
(3)
合理的t值一般可取[-2.0,2.0]之间;
不相似分格组成不相似区域,显著性区域(Saliency Region--SR)被定义为覆盖在不相似分格上的矩形区域,字符图像中非显著性区域部分即为相似区域;
根据不相似分格检测结果,计算不相似区域的矩m00,m10,m01和中心矩μ20,μ02,则不相似区域的中心和轴长分别为:
(4)
(5)
根据不相似区域中心位置,将显著性区域分成9种类型,其中心为不相似区域中心,长宽分别为:
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学;富士通株式会社,未经天津师范大学;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210225810.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于整理发电机定子引线的剪线机
- 下一篇:一种刚度可匹配橡胶支撑轴承