[发明专利]基于多标签约束支持向量机的分类方法有效
申请号: | 201210398567.X | 申请日: | 2012-10-18 |
公开(公告)号: | CN102945372A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 祁仲昂;杨名;张仲非;张正友 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟;施海寅 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于多标签约束支持向量机的分类方法,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离;然后,在特定的分类目标下对多标签空间中的每个点定义一个邻域,某点的邻域包含在新型的距离度量方法下离中心点最近的几个点,并提出了多标签邻域相似度约束;最后,结合多标签邻域相似度约束和传统的支持向量机约束,提出一种新的多标签约束支持向量机分类器进行多标签分类训练。本发明用于通过多标签约束利用多标签空间中包含的信息来提高鉴别型分类器在多标签分类中的分类精度,降低噪声标签对分类的影响。 | ||
搜索关键词: | 基于 标签 约束 支持 向量 分类 方法 | ||
【主权项】:
1.一种基于多标签约束支持向量机的分类方法,其特征在于,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离,所述新型的距离度量方法为:将多标签训练集表示为多标签训练集中的每个点都被标上了多种多样的标签,整个多标签训练集的标签字典组成了S维的多标签空间多标签训练集中的每个点在视角中的特征向量表示为xi,在标签字典中的标签向量表示为di=(di,1,di,2,...,di,S)′,其中di,r∈{0,1},1≤r≤S表示字典中的第r个标签Tr是否在Ii中出现,同时用yi,r表示Ii的分类标签,yi,r=2·di,r-1,在多标签一对多One Vs All的分类模式中,当一个标签Tr被作为分类目标时,标签字典中其余的标签就会组成一个S-1维的标签特征空间用ti,r表示Ii在空间中的特征向量,ti,r=(di,1,...,di,r-1,di,r+1,...,di,s)′,定义当给定di,k=0or1时,di,r=0or1的条件概率如下所示:P 10 = Δ P ( d i , r = 1 | d i , k = 0 ) = 1 - P 00 ]]>P 01 = Δ P ( d i , r = 0 | d i , k = 1 ) = 1 - P 11 ]]> 将每一个标签Tr的关联度向量标记为gr,gr=(gr,1,...,gr,r-1,gr,r+1,...,gr,S)′;向量的每一个元素表示标签Tr与其他标签的关联度;关联度元素gr,k(k∈{1,...,r-1,r+1,...,S})的定义如下式所示:gr,k=P00·P11+P10·P01,将样本点在空间中的特征向量与每一个标签Tr关联度向量结合起来,得到多标签空间中一种新型的距离度量方法的定义如下式所示:disr(Ii,Ij)=||(ti,r-tj,r)⊙gr||p,其中⊙表示向量之间的阿达马Hadamard乘积;然后,在特定的分类目标下对多标签空间中的每个点定义一个邻域,某点的邻域包含在新型的距离度量方法下离中心点最近的几个点,并提出了多标签邻域相似度约束,所述的邻域以及多标签邻域相似度约束的建立方法为:Ii在空间中用这种新型距离度量方法定义的邻域,不包括Ii自己,表示为Ii和其邻域中数据点的分类结果相似度高,和非邻域数据点的分类结果相似度低,邻域的大小u表示Ii在空间中的最邻近的邻居点的个数,所述多标签约束支持向量机通过添加多标签空间邻域相似度约束来最小化每一个点和其在多标签空间中最邻近的邻居点的分类结果之间的差异,该约束如下所示:且|wTxi-wTxj|≤ηij,ηij≥0;其中w是多标签约束支持向量机分类器的系数;最后,结合多标签邻域相似度约束和传统的支持向量机约束,提出一种新的多标签约束支持向量机分类器进行多标签分类训练,所述新的多标签约束支持向量机分类器的建立方法为:结合上述多标签约束条件和传统的支持向量机约束条件,整合到多标签约束支持向量机的优化式中,优化式如下所示:min w = 1 2 | | w | | 2 + C Σ i = 1 n ξ i + Σ i = 1 n Σ j ∈ N i r C * e dis r ( I i , I j ) · η ij ]]>s . t . ∀ i = 1 n : ]]>y i , r ( w T x i + b ^ ) ≥ 1 - ξ i , ]]> ξi≥0且|wTxi-wTxj|≤ηij,ηij≥0其中分别是多标签约束支持向量机分类器的系数和偏置,C和C*是常数,且C*<C,ξi是松弛变量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210398567.X/,转载请声明来源钻瓜专利网。