[发明专利]基于多标签二视角支持向量机的分类方法有效
申请号: | 201210396612.8 | 申请日: | 2012-10-18 |
公开(公告)号: | CN102945370A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 祁仲昂;杨名;张仲非;张正友 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟;施海寅 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于多标签二视角支持向量机的分类方法,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离;然后,在两个相互条件独立的视角上提取训练集的两组特征,结合利用二视角所包含的两组特征的互补信息;最后,结合多标签空间和二视角空间中的信息,利用定义的一种新的多标签二视角支持向量机分类器进行多标签分类训练。本发明用于采用鉴别型分类器结合利用标签空间中所包含的信息和多视角中的信息处理多标签分类问题,对训练集标签进行降噪的同时,得到一种更准确的分类方法。 | ||
搜索关键词: | 基于 标签 视角 支持 向量 分类 方法 | ||
【主权项】:
1.一种基于多标签二视角支持向量机的分类方法,其特征在于,包括以下步骤:首先,在多标签空间中定义一种新型的距离度量方法,用来衡量在特定的分类目标下多标签空间中点与点之间的距离,其中所述新型的距离度量方法为,将多标签训练集表示为所述多标签训练集的两个相互条件独立的视角空间分别表示为和所述多标签训练集中的每个点都被标上了多种多样的标签,所述多标签训练集的标签字典组成了S维的多标签空间所述多标签训练集中的每个点在视角空间和中的特征向量分别表示为和在标签字典中的标签向量表示为di=(di,1,di,2,...,di,S)′,其中di,r∈{0,1},1≤r≤S表示标签字典中的第r个标签Tr是否在Ii中出现,同时用yi,r表示Ii的分类标签,yi,r=2·di,r-1,在多标签一对多的分类模式中,当一个标签Tr被作为分类目标时,标签字典中其余的标签就会组成一个S-1维的标签特征空间用ti,r表示Ii在空间中的特征向量,其中ti,r=(di,1,...,di,r-1,di,r+1,...,di,S)′,定义当给定di,k=0or 1时,di,r=0or1的条件概率如下所示:P 10 = Δ P ( d i , r = 1 | d i , k = 0 ) = 1 - P 00 ]]>P 01 = Δ P ( d i , r = 0 | d i , k = 1 ) = 1 - P 11 ]]> 将每一个标签Tr的关联度向量标记为gr,gr=(gr,1,...,gr,r-1,gr,r+1,...,gr,S)′,向量的每一个元素表示标签Tr与其他标签的关联度,关联度元素gr,k(k∈{1,...,r-1,r+1,...,S})的定义如下式所示:gr,k=P00·P11+P10·P01,将样本点在空间中的特征向量与每一个标签Tr关联度向量结合起来,得到多标签空间中一种新型的距离度量方法的定义如下式所示:disr(Ii,Ij)=||(ti,r-tj,r)⊙gr||p,其中⊙表示向量之间的阿达马Hadamard乘积;然后,在两个相互条件独立的视角上提取训练集的两组特征,结合利用二视角所包含的两组特征的互补信息;最后,结合多标签空间和二视角空间中的信息,利用定义的一种新的多标签二视角支持向量机分类器进行多标签分类训练,所述新的多标签二视角支持向量机分类器的建立方法为:Ii在标签特征空间中定义的邻域,不包括Ii自己,表示为Ii和其邻域中数据点的分类结果相似度高,和非邻域数据点的分类结果相似度低,邻域的大小u表示Ii在空间中的最邻近的邻居点的个数,将和分别标记为和通过最大化同一个样本点在两个视角下的分类相似度来添加二视角约束,该二视角约束如下所示:∀ i = 1 n : | w ( a ) T x i ( a ) + b ^ ( a ) - w ( b ) T x i ( b ) - b ^ ( b ) | ≤ η i , η i ≥ 0 ]]> 其中w(z),分别是多标签二视角支持向量机分类器MSVM-2K在视角z=a,b上的系数和偏置,通过最小化每一个点和其在多标签空间中最邻近的邻居点的分类结果在同一个视角和在不同视角之间的差异来添加多标签约束,多标签约束如下所示:且| w ( a ) T x i ( a ) - w ( a ) T x j ( a ) | ≤ η ij ( aa ) , η ij ( aa ) ≥ 0 - - - ( 1 ) ]]>| w ( b ) T x i ( b ) - w ( b ) T x j ( b ) | ≤ η ij ( bb ) , η ij ( bb ) ≥ 0 - - - ( 2 ) ]]>| w ( a ) T x i ( a ) + b ^ ( a ) - w ( b ) T x j ( b ) - b ^ ( b ) | ≤ η ij ( ab ) , η ij ( ab ) ≥ 0 - - - ( 3 ) ]]>| w ( b ) T x i ( b ) + b ^ ( b ) - w ( a ) T x j ( a ) - b ^ ( a ) | ≤ η ij ( ba ) , η ij ( ba ) ≥ 0 - - - ( 4 ) ]]> 利用柔性分类标签来替代同一个视角下的多标签约束(1)和(2);同时,只选取不同视角下的多标签约束(3)和(4)中的一个以降低计算复杂度,将每个点Ii的柔性分类标签标记为li,r,li,r的取值不仅取决于Ii的分类标签yi,r,还取决于Ii在空间中最邻近的邻居点的分类标签,li,r的定义如下所示:D是常量,且0≤D<1,多标签二视角支持向量机的优化式如下所示:C ij = C ( ab ) i = j C ( ab ) * / e dis r ( I i , I j ) i ≠ j ]]>s . t . ∀ i = 1 n : l i , r ( w ( a ) T x i ( a ) + b ^ ( a ) ) ≥ | l i , r | 2 - | l i , r | ξ i ( a ) , ξ i ( a ) ≥ 0 ]]>l i , r ( w ( b ) T x i ( b ) + b ^ ( b ) ) ≥ | l i , r | 2 - | l i , r | ξ i ( b ) , ξ i ( b ) ≥ 0 ]]> 且| w ( a ) T x i ( a ) + b ^ ( a ) - w ( b ) T x j ( b ) - b ^ ( b ) | ≤ η ij ( ab ) , η ij ( ab ) ≥ 0 ]]> 其中C(a),C(b),C(ab),C(ab)*和D是常量,C(ab)*<C(ab),0≤D<1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210396612.8/,转载请声明来源钻瓜专利网。
- 上一篇:复合板厨具外表面处理工艺
- 下一篇:一种石墨烯表面高k栅介质的集成方法