[发明专利]基于子空间表示和全局消歧方法的偏标记学习方法在审
申请号: | 202010411587.0 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111581467A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 李浥东;冯松鹤;孙悦;郎丛妍 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06N20/00 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 表示 全局 方法 标记 学习方法 | ||
本发明提供了一种基于子空间表示和全局消歧方法的偏标记学习方法。该方法包括:构建特征矩阵和候选标记矩阵;基于构建特征矩阵和候选标记矩阵,构建特征子空间学习模型和标记全局消歧模型;综合特征子空间学习模型和标记全局消歧模型得到混合模型,采用交替优化方法求解混合模型,得到多分类模型、映射矩阵和偏标记置信度矩阵;根据多分类模型和映射矩阵对未见示例进行分类,计算出未见示例的多个标记值,将预测置信度最高的标记值对应的标记确定为未见示例所属的标记类别。本发明可同时利用特征子空间表示法和标记全局消歧方法,同时从特征和标记两方面解决偏标记学习问题,所获特征具有更强表征能力;生成的标记置信度矩阵有更好的消歧效果。
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种基于子空间表示和全局消歧方法的偏标记学习方法。
背景技术
偏标记学习可以被看作一种弱监督的学习框架,这种学习框架的目的是从有候选标签集合的样本中学到一个多分类模型。这种学习框架在现实社会中有着广泛的应用,比如:自动标注系统,来自不同背景的人做了不同的标注,但是其中只有一个标记是正确标注;一篇新闻报道出现了多人的名字和一张合照,我们需要把人名与合照中的人脸匹配。现有的偏标记学习方法可以被分作三类,平均消歧的学习策略、辨识消歧的学习策略和非消歧的学习策略。
平均消歧策略认为每个标签对学习模型做了相同的贡献,并且通过平均化模型输出对测试样本做出预测。针对这个策略的代表方法有:基于k近邻的平均消歧方法,基于最小化损失函数的消歧方法和基于最小化重构损失的消歧方法等等。基于平均消歧策略的方法比较直观,容易实现。但是因为在训练模型的过程中真实标记容易受到伪标记影响,训练模型的效果受到影响。
辨识消歧策略把真实标记看作一个隐变量,通过迭代达到最大化模型输出。辨识消歧策略算法主要基于两大准则:极大似然准则和最大化间隔准则基于辨识消歧策略的方法,比基于平均消歧策略的方法性能的准确率更优,但是也存在着一个潜在的缺陷,训练得到的标记可能是伪标记,而不是真实标记。
现有技术中的偏标记学习方法的缺点包括:
1)消歧策略对每个训练示例单独消歧,忽略了偏标记学习的全局标记语义信息,消歧得到的真实标记有待进一步改进;
2)现有的偏标记学习策略倾向于直接利用原始特征空间学习,但是在高维数据中,冗余特征不可避免地会混杂在原始数据中,这样不仅会增加训练过程的时间和空间开销,并且会降低模型的泛化性能。
发明内容
本发明的实施例提供了一种基于子空间表示和全局消歧方法的偏标记学习方法,以克服现有技术的问题。
为了实现上述目的,本发明采取了如下技术方案。
一种基于子空间表示和全局消歧方法的偏标记学习方法,包括:
构建特征矩阵和候选标记矩阵;
基于所述构建特征矩阵和候选标记矩阵,构建特征子空间学习模型和标记全局消歧模型;
综合所述特征子空间学习模型和所述标记全局消歧模型得到混合模型,采用交替优化方法求解所述混合模型,得到多分类模型、映射矩阵和偏标记置信度矩阵;
根据所述多分类模型和所述映射矩阵对未见示例进行分类,计算出所述未见示例的多个标记值,将预测置信度最高的标记值对应的标记确定为所述未见示例所属的标记类别。
优选地,所述的构建特征矩阵和候选标记矩阵,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010411587.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:立体车库
- 下一篇:一种双层宽度方向扩展的方舱结构