[发明专利]一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法有效
申请号: | 201110108773.8 | 申请日: | 2011-04-28 |
公开(公告)号: | CN102184425A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 金连文;刘岗;丁凯 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 鉴别 空间 增量 二次 函数 书写 自适应 方法 | ||
技术领域
本发明属于利用计算机处理设备识别手写文字图像的技术领域,特别是涉及一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法。
技术背景
手写汉字识别一般是指用户通过手写输入设备(比如:手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来,对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
发明内容
本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。
本发明采用的技术方案为:
一种基于鉴别子空间的增量二次鉴别函数的书写者自适应方法,其步骤如下:
(1)、选取少量的特定用户的增量样本;
(2)、对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型;
(3)、利用更新后的线性鉴别分析(LDA)模型,计算增量样本在新的线性鉴别分析(LDA)特征空间中每个类的均值向量和协方差矩阵;
(4)、利用更新后的线性鉴别分析(LDA)模型,计算原始样本在新的线性鉴别分析(LDA)特征空间中每个类的均值向量和协方差矩阵;
(5)、计算合并后总样本在新的线性鉴别分析(LDA)特征空间中每个类别的均值向量和协方差矩阵;
(6)、根据合并后总样本在新的线性鉴别分析(LDA)特征空间中每个类的均值向量和协方差矩阵,更新改进的二次鉴别函数(MQDF)分类器。
所述步骤(1)为选择特定用户少量的样本,用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为X = {xi} (i=1, … , N),N为样本数,并设其类别数是M;设增量样本为Y = {yj} (j=1,…,L),L为增量样本数,并设其类别数是P。则合并后的总的样本可表示为Z=X∪Y = {zk} (k=1,…,L+N),样本总数为L+N,类别总数为C,且C≥M、C≥P。不失一般性,我们假设对于合并后的总样本中的第Ci(i=1,…,C)类,分别在原始样本N和增量样本L中有ni和li个样本。因此,对于合并后新的样本,属于第Ci(i=1,…,C)类的样本数为si=ni+li。
所述步骤(2)对增量样本提取特征,并利用增量线性鉴别分析(ILDA)技术对原始的线性鉴别分析(LDA)模型进行更新生成新的线性鉴别分析(LDA)模型,其步骤包括:
(A)、增量样本特征提取,对于每一个增量样本,都采用八方向特征提取方法提取其方向特征;
(B)、令原始线性鉴别分析变换(LDA)矩阵为 ,设经过八方向特征提取后,增量样本中类别i(i=1,…,C)的特征向量为,则可根据增量线性鉴别分析(ILDA)技术并结合增量样本的特征向量将原始线性鉴别分析变换矩阵更新为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110108773.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:回放设备和回放方法
- 下一篇:可热封功能性拉伸薄膜