[发明专利]一种基于加权增量二次鉴别函数的书写者自适应方法无效

申请号：	201110108775.7	申请日：	2011-04-28
公开（公告）号：	CN102298704A	公开（公告）日：	2011-12-28
发明（设计）人：	金连文;刘岗;丁凯	申请（专利权）人：	华南理工大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于加权增量二次鉴别函数书写自适应方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于利用计算机处理设备识别手写文字图像的技术领域，特别是涉及一种基于加权增量二次鉴别函数的书写者自适应方法。

技术背景

手写汉字识别一般是指用户通过手写输入设备（比如：手写板、触摸屏、鼠标等）书写汉字，同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别，即书写一个汉字识别一个汉字。使用的识别引擎与用户无关，即识别引擎事先通过大量的训练样本训练出来，对于不同用户，识别引擎使用的模型及参数都是一样的，事先由开发人员训练并设置好。由于采用了大数据量的训练样本，所以识别引擎能满足书写规范的用户的识别准确率要求。但是不同用户的书写风格差异很大，每个用户书写风格除了存在共性外，往往还包括自己个性化的地方，与用户无关的识别引擎针对这类用户时书写汉字时，识别准确率往往不尽人意，有待改进。

发明内容

本发明的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足，提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。

本发明采用的技术方案为：

一种基于加权增量二次鉴别函数的书写者自适应方法，其步骤如下：

（1）、选取特定用户少量的增量样本；

（2）、对增量样本提取特征，并根据原始线性鉴别分析（LDA）模型对增量样本特征进行线性鉴别分析（LDA）变换；

（3）、利用增量样本并结合加权的增量二次鉴别函数（WIMQDF）算法，动态更新每个类别的基于加权的均值向量和协方差矩阵；

（4）、采用更新后的每个类别的基于加权的均值向量和协方差矩阵，更新改进的二次鉴别函数分类器。

所述步骤（1）为选择特定用户少量的样本，用于更新模板及识别引擎。用户样本的选择应能充分体现用户的书写风格。设原始样本为X = {x_i} (i=1, … , N)，N为样本数，并设其类别数是M；设增量样本为Y = {y_j} (j=1,…,L)，L为增量样本数，并设其类别数是P。则合并后的总的样本可表示为Z=X∪Y = {z_k} (k=1,…,L+N)，样本总数为L+N，类别总数为C，且C≥M、C≥P。不失一般性，我们假设对于合并后的总样本中的第i (i=1,…,C)类，分别在原始样本N和增量样本L中有n_i和l_i个样本。因此，对于合并后新的样本，属于第i (i=1,…,C)类的样本数为s_i=n_i+l_i。