[发明专利]一种同时实现聚类、分类和度量学习的模式识别方法无效
申请号: | 201210178760.2 | 申请日: | 2012-06-01 |
公开(公告)号: | CN102750545A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 蔡维玲;杨明 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 同时 实现 分类 度量 学习 模式识别 方法 | ||
1.一种同时实现聚类、分类和度量学习的模式识别方法,包括如下步骤:
步骤1:对带有类标签的数据集合,建立一种可同时进行聚类学习和分类学习的模式识别机制,具体过程如下:
a)对于给定训练样本及其类标号集合{xi,yi},其中xi∈Rd且yi∈{1,2,…,L},建立如下目标函数:
其中f(xi)和yi分别为样本xi的输出类别和期望类别;δ是损失函数,当f(xi)=yi,值为0,否则为1;q(X)表示聚类不纯度,参数β决定聚类纯度在目标函数中的重要程度,在{0.01,0.1,1}中选取;
b)确定所述目标函数中的f(xi):
利用全概率公式,p(ωl|xi)可由下式计算:
其中,p(cj|xi)是样本xi的聚类后验概率
其中的距离采用基于径向基核诱导出来的距离度量;
p(ωl|cj)表示聚类的类后验概率,根据贝叶斯规则:
对于每一个聚类cj,p(ωl|cj)满足下面的约束:
c)将所有的聚类的类后验概率p(ωl|cj)组建成一个c×L的矩阵P,其中c为聚类个数,L为类别个数:
第i行元素[p(ω1|ci),p(ω2|ci),…,p(ωL|ci)]表示第i个聚类和所有类别间的关系并且满足第j列元素[p(ωj|c1),p(ωj|c2),…,p(ωj|cc)]表示第j个类别和所有聚类间的关系;
步骤2:将度量学习结合到聚类学习和分类学习中,建立一种同时实现聚类、分类和度量学习的模式识别机制,具体过程如下:
a)定义度量学习问题:
样本点x和y之间的距离如下:
其中x∈Rd;A是待学习矩阵,并且为对角阵,A∈Rd×d;
b)通过将所述待学习矩阵A引入基于径向基核的距离度量中,建立基于矩阵A的新距离度量:
其中表示第p维特征的权值并且满足表示线性变化后的聚类中心;
c)建立基于所述新距离度量的模式识别机制:
通过采用新距离度量dA(x,y)代替原始距离d(x,y),产生SCCM的目标函数:
其中第一项是分类错误率,第二项是聚类不纯度,表示第p维特征的权值,表示新空间中的第j个聚类中心;
步骤3:采用粒子群方法优化SCCM学习方法中的待定参数,具体过程如下:
a)选取特征初始权值:
通过下列目标函数选取特征初始权值:
其中Dl表示类别是l的所有样本的下标集合,采用改进的粒子群方法优化该目标函数,可得到一组初始权值
b)以所述初始权值为基础,再通过改进的粒子群方法同时优化公式(9)的目标函数中的特征权值和聚类中心
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210178760.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全天候气动手动转换机构
- 下一篇:基于语音识别的手机解锁方法