[发明专利]多示例多标记框架下基于域适应迁移学习设计方法和系统在审
申请号: | 201610116295.8 | 申请日: | 2016-03-01 |
公开(公告)号: | CN105787513A | 公开(公告)日: | 2016-07-20 |
发明(设计)人: | 吴建盛;郑茂;胡海峰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 汪旭东 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了多示例多标记框架下基于域适应迁移学习设计方法和系统,该方法将多示例多标记学习与迁移学习统一到同一个框架,有效地利用源域数据样本与目标域数据样本统计相关性,使得源域样本可以有效的被用于目标域任务的学习;利用源域数据样本集合与目标域数据样本集合在RKHS中的特性,通过使用样本加权和基于聚类的样本选择机制构成的两步域适应过程,使得目标任务的学习有足够的从源域样本集合中加权和挑选的训练样本;利用miFV算法将多示例转化为单示例,解决了域适应的计算代价问题。 | ||
搜索关键词: | 示例 标记 框架 基于 适应 迁移 学习 设计 方法 系统 | ||
【主权项】:
一种多示例多标记框架下基于域适应迁移学习设计方法,其特征在于,所述方法包括如下步骤:步骤1:给定输入多示例多标记集:源域数据集DS={(Xi,Yi)|1≤i≤ns}已标记目标域数据集DL={(Xi,Yi)|1≤i≤nl}未标记目标域数据集DU={Xi|1≤i≤nu};其中,包含zi个样本示例,Yi={yi,1,…,yi,n}为第i样本包的标记,其中yi,j=±1,DL∪DU=DT,DL∩DU=φ,nl+nu=nt已知DS中的Yi都是已知的,目标域中存在标记已知的样本子集,且DS和DT中样本的分布是完全不同的;步骤2:对于DS和DT中的所有样本包Xi执行miFV算法,将原始的多示例样本包压缩为(2d+1)K维的单实例Fisher向量;步骤3:对单示例化后的源域数据集DS′和目标域数据集DT'执行KMM算法,计算出源域样本的权重向量其中αi对应源域中第i个样本的权重值;步骤4:对目标域的已标记数据集DL和源域数据集DS,执行“二分K‑means聚类”,计算出源域数据集的抽取向量其中βi=0或1;步骤5:根据步骤3和步骤4计算出的两个向量α和β,选择合适的多标记分类器h(x),优化本发明提出的优化式(11),确定最优分类器h(x)的所有参数;步骤6:根据多标记分类器,得到未标记目标域数据集DU的预测标记集合,即:分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610116295.8/,转载请声明来源钻瓜专利网。