[发明专利]基于核鉴别线性表示的分类方法在审
申请号: | 201410026937.6 | 申请日: | 2014-01-21 |
公开(公告)号: | CN103761533A | 公开(公告)日: | 2014-04-30 |
发明(设计)人: | 刘茜 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 210044 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 鉴别 线性 表示 分类 方法 | ||
技术领域
本发明涉及基于核鉴别线性表示的分类方法,属于模式识别的技术领域。
背景技术
模式分类是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式分类可以应用到文字识别、语音识别、指纹识别、数据挖掘、遥感图像识别、医学诊断等多个领域。
用于模式分类的方法很多,比如,中国专利申请201310060437.X于2013年2月26日公开的“基于鉴别线性表示的模式分类方法”,将训练样本集按照样本类别划分为子训练样本集,计算测试样本在各子训练样本集内的线性表示系数,然后计算测试样本在每一个子训练样本集内的重构误差,当测试样本在某类子训练样本集内的重构误差最小时,将测试样本归为这一类。通过减少训练样本数目,降低了计算难度,但是识别率不高。
发明内容
本发明的目的,在于提供一种基于核鉴别线性表示的分类方法,大大提高了识别精度。
为了实现上述目的,本发明所采用的技术方案如下:
基于核鉴别线性表示的分类方法,利用训练样本集识别测试样本所属的类别,首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,各个样本类别的新的训练样本构成新的子训练样本集,然后计算新的测试样本在各个新的子训练样本集内的重构误差,最后将测试样本归为重构误差最小的新的子训练样本集所对应的那一类,所述预处理为采用核主成分分析方法(Kernel Principal Component Analysis,KPCA)对待处理样本做降维运算,再对降维后的所有样本做归一化运算。
优选的,所述归一化运算采用的方法为L2-norm归一化方法。
一种人脸识别方法,对人脸数据库中的人脸图像进行预处理,从预处理后的人脸图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化后和列向量化得到的训练样本和测试样本数据,使用如上所述基于核鉴别线性表示的分类方法识别测试样本所属的类别。
一种手写体数字识别方法,对手写体数字数据库中的数字图像进行预处理,从预处理后的数字图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化和列向量化后得到的训练样本和测试样本数据,使用如上所述基于核鉴别线性表示的分类方法识别测试样本所属的类别。
采用上述方案后,本发明的基于核鉴别线性表示的分类方法相比于现有技术,将训练样本集和测试样本中的所有样本预先分别进行核化处理后再进行模式分类,进一步提高了识别精度。
具体实施方式
下面对本发明的技术方案作进一步详细的说明。
利用包括c个类别的训练样本集X识别测试样本y所属的类别,包括如下步骤。
令X=[X1,X2,…,Xc],表示第i类训练样本集,Xi包含Ni个样本,xij∈Rd(Rd表示d维的实向量集合)表示第i类的第j个训练样本,(i=1,2,…,c;j=1,2,…,Ni),y∈Rd,c为大于1的自然数,Ni为自然数。
步骤1,对训练样本集X和测试样本y中的所有样本做核映射、降维和归一化运算,得到新的训练样本集和新的测试样本;通过核映射φ:Rd→F将训练样本集X和测试样本y中的所有样本从d维的线性空间映射到高维的非线性空间F(F的维数远大于d),则训练样本xij映射为φ(xij),测试样本y映射为φ(y)。令φ(X)=[φ(X1),φ(X2),…,φ(Xc)]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410026937.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多芯体并联组合式散热器
- 下一篇:柴油机排气检测的连接装置