[发明专利]层次性多示例多标记学习的设计方法和系统在审
申请号: | 201611007382.6 | 申请日: | 2016-11-16 |
公开(公告)号: | CN106650947A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 吴建盛;冯巧遇;胡海峰;耿静静 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 李湘群 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 层次 示例 标记 学习 设计 方法 系统 | ||
1.一种基于层次性多示例多标记学习的设计方法,其特征在于,所述方法包括如下步骤:
步骤1:给定输入多示例多标记训练数据集:
D={(Xi,Yi)|1≤i≤N},Xi包含ni个示例(每个样本包含示例个数可能不一样,每个示例为d维),Yi={yi,1,…,yi,n}为第i个样本包对应的标记,以及多示例测试集T={Xt},
步骤2:将所有样本包Xi,以及测试包Xt进行多示例单示例化,将原始的多示例样本包压缩为单示例向量;
步骤3:基于上述步骤2中将多示例样本包转化为单示例向量,从而将多示例多标记学习问题转换为多标记学习问题;
步骤4:给定测试集T,通过多标记学习算法,预测每一个测试样本Xt的类别标记集
步骤5:结合标记之间层次性结构的关系,重新优化、调参,最终预测出层次性结构的标记集合这就是测试样本Xt的层次性类别标记集。
2.根据权利要求1所述的一种基于层次性多示例多标记的设计方法,其特征在于,所述方法包括多示例单示例化、多标记学习、层次性结点被错误分类的代价优化、标记间层次性结构的优化。
3.根据权利要求2所述的一种基于层次性多示例多标记的设计方法,其特征在于,所述多示例转化为单示例问题,虽然多示例描述包的信息相对比较完整,将多示例转化为能最大程度保留包的信息的单示例向量。
4.根据权利要求1所述的一种基于层次性多示例多标记的设计方法,其特征在于,所述多标记学习问题,是利用分类准则对训练集进行统计和分析,然后基于得到的统计信息,通过最大后验概率准则预测新样本的标记集合。
5.根据权利要求2所述的一种基于层次性多示例多标记的设计方法,其特征在于,所述的层次性被错分结点的代价损失,是将层次性结构中所有被错分结点信息考虑在内,确保同层结点代价损失不同,通过sigmoid函数:之后,缩小了每个被错分结点上代价损失之间的差距,合理优化了代价损失的数值,间接提高了模型的预测性能。
6.根据权利要求1所述的一种基于层次性多示例多标记的设计方法,其特征在于,所述步骤4预测出的测试样本的标记集,再结合标记的层次性结构,重新优化、调参,最终预测出测试样本的层次性标记集合。
7.一种层次性多示例多标记学习的设计系统,其特征在于:所述系统包括多示例单示例化模块、多标记学习模块、标记间层次性结构的优化模块;
多示例单示例化模块是将多示例学习的样本包映射为一个新的能够最大程度保留包信息的向量表示,简化示例空间的复杂度,从而将多示例多标记学习问题退化为多标记学习问题;
多标记学习模块是根据训练数据建立模型,来预测新样本的类别标记集合;
标记间层次性结构的优化模块是将由多标记学习得到的预测结果,结合标记的层次性结构,重新优化、调参,最终得到新样本的层次性标记集合。
8.根据权利要求7所述的一种层次性多示例多标记学习的设计系统,其特征在于:所述系统包括层次性被错分结点的代价优化模块;
所述的层次性被错分结点的代价优化模块考虑了所有被错分节点的代价损失,保证了每一层被错分结点的代价权重不一样,同时缩小了每个被错分结点上代价损失之间的差距,体现了层与层之间代价损失数值的合理性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611007382.6/1.html,转载请声明来源钻瓜专利网。