[发明专利]一种基于标记协方差和多标记分类的联合学习方法在审

专利信息
申请号: 201710430547.9 申请日: 2017-06-09
公开(公告)号: CN107330448A 公开(公告)日: 2017-11-07
发明(设计)人: 杨明;吕静;何志芬;杨琬琪;蔡维玲;宋凤义 申请(专利权)人: 南京师范大学
主分类号: G06K9/62 分类号: G06K9/62;G06N99/00
代理公司: 南京经纬专利商标代理有限公司32200 代理人: 刘传玉
地址: 210024 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 标记 协方差 分类 联合 学习方法
【权利要求书】:

1.基于标记协方差和多标记分类的联合学习方法,其特征在于,包括如下步骤:

步骤1),标记相关性矩阵初始化为单位矩阵,即假设初始化时同一标记之间是相关的,而不同标记之间不相关;

步骤2),运用标记协方差和多标记分类的联合学习算法JLSML学习得到分类模型参数、标记相关性以及阈值函数所对应的参数:交替迭代更新标记相关性矩阵、分类器参数和阈值函数所对应的参数,直到满足迭代终止条件输出学习得到的分类模型参数、标记相关性以及阈值函数所对应的参数;

步骤3),模型预测:首先运用学习得到的分类模型参数、阈值函数所对应的参数进行标记预测,得到分类结果;然后根据多标记数据的分类模型预测所有待分类的多标记数据的标记;最后输出多标记数据的分类结果。

2.根据权利要求1所述的基于标记协方差和多标记分类的联合学习方法,其特征在于,步骤1)具体包括如下步骤:

步骤1.1),标记相关性矩阵S=IQ,其中,IQ为Q×Q的单位矩阵;

步骤1.2),归一化处理,使每个特征对应的特征向量的2范数为1。

3.根据权利要求2所述的基于标记协方差和多标记分类的联合学习方法,其特征在于,步骤2)具体包括以下步骤:

步骤2.1),令为预先设定的包含n个样本的训练集,其中,xi∈Rd表示第i个训练样本,Rd为d维的实数空间,Yi∈{+1,-1}Q表示其相应的标记向量,d表示特征空间的维数,Q表示标记个数;

若Yiq=+1,则表示第i个样本隶属于第q个标记,否则表示第i个样本不隶属于第q个标记;

步骤2.2),令虚拟标记v作为样本的相关标记和不相关标记的自然划分点,虚拟标记v所对应的函数参数为wv∈Rd和bv∈R,对应的函数为其中,R为实数空间;

步骤2.3),将多标记分类问题转化为Q个两类分类问题,第q个标记所对应的判别函数定义如下:

fq(x)=wqTx+bq]]>

其中,wq∈Rd和bq∈R分别表示第q个线性分类函数所对应的权重和偏差;

若fq(x)≥fv(x),则认为第q个标记为样本x的相关标记,否则为样本x的不相关标记;

步骤2.4),建立基于标记协方差和多标记分类的联合学习算法JLSML的模型:

minW,wv,b,bv,SCΣq=1QΣi=1nξiq+12Σq=1Q||wq||2+12||wv||2+λ2tr(WS-1WT)]]>

s.t.Yiq(wqTxi+bq-wvTxi-bv)1-ξiq]]>

ξiq≥0,i=1,...,n;q=1,...,Q

S≥0

tr(S)=1

式中,第一项为损失项,第二项和第三项用来控制模型的复杂度,第四项为度量标记之间的相关性,并且约束协方差矩阵S是半正定的,tr(·)表示矩阵的迹,λ为正则化参数,W为权重矩阵,b=[b1,…,bQ]为偏差向量,ξiq为松弛变量,xi为第i个训练样本;

步骤2.5),将联合学习算法JLSML模型拓展到再生核希尔伯特空间中学习,即将d维空间中的样本x转化为希尔伯特空间中的φ(x),其中φ:表示由核引导的特征映射,则:

minW,wv,b,bv,SCΣq=1QΣi=1nξiq+12Σq=1Q||wq||2+12||wv||2+λ2tr(WS-1WT)]]>

s.t.Yiq(wqTφ(xi)+bq-wvTφ(xi)-bv)1-ξiq]]>

ξiq≥0,i=1,...,n;q=1,...,Q

tr(S)=1

步骤2.6),固定S,更新联合学习算法JLSML模型的对偶函数解;

步骤2.6.1),当S固定时,优化W,wv,b和bv,则:

minW,wv,b,bvCΣq=1QΣi=1nξiq+12tr(W(IQ+λS-1)WT)+12||wv||2]]>

s.t.Yiq(wqTφ(xi)+bq-wvTφ(xi)-bv)1-ξiq]]>

ξiq≥0,q=1,...,Q;i=1,...,n

步骤2.6.2),令拉格朗日函数为:

L=CΣq=1QΣi=1nξiq+12tr(W(IQ+λS-1)WT)+12||wv||2-Σq=1QΣi=1nαiq(Yiq(wqTφ(xi)+bq-wvTφ(xi)-bv)+1+ξiq)-Σq=1QΣi=1nβiqξiq]]>

其中,αiqiq≥0为拉格朗日乘子;

步骤2.6.3),分别对L关于W,wv,bq,bv和ξiq求导,并令它们等于0:

LW=W(IQ+λS-1)-Σq=1QΣi=1nαiqYiqφ(xi)eqT=0W=Σq=1QΣi=1nαiqYiqφ(xi)eqT(IQ+λS-1)-1]]>

Lwv=wv+Σq=1QΣi=1nαiqYiqφ(xi)=0wv=-Σq=1QΣi=1nαiqYiqφ(xi)]]> 2

Lbq=-Σi=1nαiqYiq=0Σi=1nαiqYiq=0]]>

Lbv=Σq=1QΣi=1nαiqYiq=0Σq=1QΣi=1nαiqYiq=0]]>

Lξiq=C-αiq-βiq=0αiq+βiq=C]]>

min{αq}q=1Q12Σq=1QΣi=1nΣr=1QΣj=1nαiqαjrYiqYjr[eqT(IQ+λS-1)-1er+1]k(xj,xi)-Σq=1QΣi=1nαiq]]>

s.t.Σi=1nαiqYiq=0]]>

0≤αiq≤C,q=1,...,Q;i=1,...,n

其中,αq=[α1q,...,αnq]T,k(xj,xi)=<φ(xj),φ(xi)>,k(·,·)为核函数;

步骤2.6.4),采用基于Frank-Wolfe方法的有效训练算法来求解拉格朗日乘子

步骤2.7),由求W,wv,b和bv,并根据如下KKT条件来计算bq-bv

Yiq(wqTφ(xi)-wvTφ(xi)+bq-bv)=1if0αiqC,q=1,...,Q;i=1,...,n]]>

Yiq(Σr=1QΣj=1nαjrYjr(eqT(IQ+λS-1)-1er+1)k(xj,xi)+(bq-bv))=1if0αiqC,q=1,...,Q;i=1,...,n;]]>

步骤2.8),固定更新S:

minStr(S-1WTW)]]>

tr(S)=1

其中,

tr(S-1WTW)=tr(S-1WTW)tr(S)=tr(S-12(WTW)12(WTW)12S-12)tr(S12S12)(tr(S-12(WTW)12S12))2=(tr((WTW)12))2]]>

S=(WTW)12tr((WTW)12)]]>

步骤2.9),判断S是否收敛或达到预设的最大迭代次数,若S没有收敛或达到预设的最大迭代次数,则跳转执行步骤2.6),直至满足终止条件;

步骤2.10),得到标记相关性矩阵、分类器和阈值函数对应的参数。

4.根据权利要求3基于标记协方差和多标记分类的联合学习方法,其特征在于,所述步骤3)具体包括如下步骤:

步骤3.1),对未标记样本进行归一化处理;

步骤3.2),计算未知样本xu在第q个标记上的判别函数值

其中,为样本xu的特征映射;

步骤3.3),计算未知样本xu的类别标记向量:

其中,sgn(·)为符号函数;

步骤3.4),输出每个样本对应的标记集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710430547.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top