[发明专利]跨媒体多视角非完美标签学习方法有效

申请号：	201210396335.0	申请日：	2012-10-18
公开（公告）号：	CN102945255A	公开（公告）日：	2013-02-27
发明（设计）人：	祁仲昂;杨名;张仲非;张正友	申请（专利权）人：	浙江大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	杭州宇信知识产权代理事务所(普通合伙) 33231	代理人：	张宇娟;施海寅
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种跨媒体多视角非完美标签学习方法，包括以下步骤：对非完美标签训练集进行预处理，在两个相互条件独立的视角上提取训练集的两组特征；利用两组特征和训练集现有的非完美标签，利用一种新的多标签二视角柔性支持向量机中进行训练，得到一组训练参数；利用这组训练参数对训练集在两个视角和中分别独立进行再分类，得到训练集在两个视角中的两组独立的分类结果；对这两组分类结果和进行概率化处理，得到训练集在两个视角中的两组独立的概率化的分类结果；利用提出的一组新的补全和去噪算法，得到训练集新的非完美标签；直到得到的训练集新的非完美标签和原有的非完美标签变化小于设定的阈值，则终止迭代过程。
搜索关键词：	媒体视角完美标签学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种跨媒体多视角非完美标签学习方法，其特征在于，包括以下步骤：步骤1，对非完美标签训练集进行预处理，在两个相互条件独立的视角上提取训练集的两组特征，其中对非完美标签训练集进行预处理的方法为：将非完美标签训练集表示为训练集的两个相互条件独立的视角分别表示为和训练集中的每个点都被标上了多种多样的标签，整个训练集的标签字典组成了S维的多标签空间当任何一个标签T_r(1≤r≤S)作为二分类的目标时，其余的标签就会组成一个S-1维的标签特征空间训练集中的每个点在两个视角中的特征向量分别表示为和在标签字典中的标签向量表示为d_i＝(d_i，1，d_i，2，...，d_i，S)′，其中d_i，r∈{0，1}，1≤r≤S表示字典中的第r个标签T_r是否在I_i中出现，对于每一个标签T_r，1≤r≤S，一个包含有D_r个点的非完美标签训练集表示为对于中的每一个点I_i，用y_i，r表示I_i的权重，用和分别表示分类器对I_i在两个视角和中的输出值，用和分别表示I_i在两个视角和中的校准后验概率，权重y_i，r∈[-1，1]，值越大代表标签T_r出现在数据点I_i中的概率越大，反之值越小代表标签T_r不会出现在数据点I_i中的概率越大；步骤2，利用所述两组特征和训练集现有的非完美标签，利用提出的一种新的多标签二视角柔性支持向量机中进行训练，得到一组训练参数，其中所述多标签二视角柔性支持向量机的建立方法为：在多标签一对多One Vs All的分类模式中，当一个标签T_r被作为分类目标时，标签字典中其余的标签就会组成一个S-1维的标签特征空间在空间中距离越近的点他们的分类相似度也越高，用L_i表示I_i在空间中的特征向量，L_i＝(d_i，1，...，d_i，r-1，d_i，r+1，...，d_i，s)′，L_i在空间中的领域，包括L_i自己，表示为L_i和其领域中数据点的分类结果相似度高，和非邻域数据点的分类结果相似度低，令多标签二视角柔性支持向量机MSS-2K分类器的优化式如下所示；Cij=Ci=jC*/edis(Li,Lj)i≠j(C*<C)]]>s.t.∀i=1n:yi(w(a)Txi(a)+b^(a))≥|yi|2-|yi|ξi(a),ξi(a)≥0]]>yi(w(b)Txi(b)+b^(b))≥|yi|2-|yi|ξi(b),ξi(b)≥0]]>|w(a)Txi(a)+b^(a)-w(b)Txj(b)-b^(b)|≤ηij(ab),ηij(ab)≥0]]>其中w^(z)，分别是分类器MSS-2K在视角z＝a，b上的系数和偏置，C^(a)，C^(b)，C，和C^*都是常数；步骤3，在分类器MSS-2K在每个标签T_r(1≤r≤S)上都完成训练之后，得到训练器的一组参数z＝a，b，利用这组训练参数对训练集在两个视角和中分别独立进行再分类，得到训练集在两个视角中的两组独立的分类结果和训练集中每个数据点在分类器上的输出值都可以通过计算得到fi,r(z)=wr(z)Txi(z)+b^r(z);]]>步骤4，对这两组分类结果和进行概率化处理，得到训练集在两个视角和中的两组独立的概率化的分类结果和其中对分类结果进行概率化处理时，利用Sigmoid模型来计算数据点分类结果的后验概率后验概率可以通过下式得到：z＝a，b，其中A，B是模型的回归系数，可以通过最大化训练集的后验对数似然函数得到，Hr(z)=logΠi=1nP[sgn(yi,r)=1|fi,r(z)]ti,rP[sgn(yi,r)=-1|fi,r(z)]1-ti,r]]>=Σi=1nti,rlogpi,r(z)+(1-ti,r)log(1-pi,r(z)),z=a,b]]>其中ti,r=12(1+sgn(yi,r));]]>步骤5，综合这两组概率化的分类结果，结合训练集现有的非完美标签，利用提出的一组新的补全和去噪算法，进行标签补全和标签去噪，得到训练集新的非完美标签，其中处理噪声标签的算法为：对于每一个都进行下列步骤，第一步，计算第二步，进行条件判断：如果sgn(qi,rt+1)=sgn(yi,rt)]]>且qi,rt+1]]>且|yi,rt|>e,]]>则sgn(yi,rt+1)=sgn(qi,rt+1),]]>|yi,rt+1|=1;]]>否则其中处理不完整标签的算法为：第一步，对于每一个计算qi,rt+1=pi,r(a)t+1+pi,r(b)t+1-1;]]>第二步，在sgn(qi,rt+1)=-1]]>且sgn(yi,r0)=1]]>的条件下，找出Maxr=maxiqi,rt+1]]>和Minr=mintqi,rt+1;]]>第三步，对于每一个都进行下列条件判断：(1)如果sgn(qi,rt+1)=sgn(yi,rt)]]>且|qi,rt+1|>e]]>且|yi,rt|>e,]]>则sgn(yi,rt+1)=sgn(qi,rt+1),|yi,rt+1|=1;]]>(2)否则如果sgn(qi,rt+1)=-1]]>且sgn(yi,r0)=1,]]>则yi,rt+1=c·(qi,rt+1-Minr)/(Maxr-Minr),]]>其中0<c<12;]]>(3)否则，yi,rt+1=qi,rt+1;]]>步骤6，迭代步骤2至5，直到得到的训练集新的非完美标签和原有的非完美标签变化小于设定的阈值，则终止迭代过程，非完美标签学习MITL算法如下所示：首先，初始化其中初始化的方法为：对于每一个T_r，1≤r≤S，且对于每一个然后令t＝0，当t＜最大迭代次数时，对于每一个T_r，1≤r≤S都分别进行下列步骤：(1)从中随机挑选三分之二的数据点组成集合(2)用每一个数据点的和来训练分类器MSS-2K；(3)对于每一个在视角上计算I_i在分类器MSS-2K中的输出值z＝a，b；(4)在视角上用每一个数据点的和来训练Sigmoid模型，z＝a，b；(5)对于每一个在视角上用Sigmoid模型计算每个数据点I_i的z＝a，b，且用和来更新每个点I_i的权重(6)令t＝t+1，判断t是否小于最大迭代次数，如果是，则重复(1)至(6)，如果不是，则算法结束。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210396335.0/，转载请声明来源钻瓜专利网。

上一篇：多参数换位加密二进制防伪印刷方法
下一篇：一种门冬氨酸鸟氨酸的化合物及其制备方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]跨媒体多视角非完美标签学习方法有效

专利文献下载