[发明专利]基于最大均值差异的负迁移样本筛选方法有效
申请号: | 202010284561.4 | 申请日: | 2020-04-13 |
公开(公告)号: | CN111652264B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 刘龙;范江 | 申请(专利权)人: | 湖北华中电力科技开发有限责任公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N3/096 |
代理公司: | 北京中仟知识产权代理事务所(普通合伙) 11825 | 代理人: | 安胜伟 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最大 均值 差异 迁移 样本 筛选 方法 | ||
1.基于最大均值差异的负迁移样本筛选方法,其特征在于,包括如下步骤:
步骤1:对数据进行预处理
将图像变成统一的大小,并将图片进行归一化处理;
步骤2:将处理好的数据放进预训练好的深度迁移学习网络中做前向传播,并计算源领域数据和目标领域数据之间的MMD距离,通过MMD阈值来判别是否跟目标域领域数据相似;
所述步骤2的预训练过程为:
步骤2.1:通过微调的方法,将office31的数据集输入到在ImageNet上训练好的AlexNet模型,固定AlexNet的第七层全连接层,通过最小化损失项,损失项收敛后,得到一个在office31数据集上的模型,提高分辨率;
步骤2.2:通过最小化损失项,使得网络提取到的特征既可以进行分类又是域间不变的,损失项趋于收敛后,可以得到一个从源领域迁移到目标领域的模型,
在该模型中,计算一个批次的MMD约束如下:
所述MMD阈值为B=(2K/m)1/2,m指的源领域样本数量,n表示的目标领域样本数量,X表示源域数据,Y表示目标域数据,k(xi,yj)表示核函数;
步骤3:通过MMD距离来修正每个类别中样本的权值;
步骤4:重复步骤2-3步骤,迭代100000次之后,得到一个最终的权值,并进行排序,设置临界值来取前N个样本,为该类别的正迁移的样本;
步骤5:将源领域的正迁移样本重新输入深度迁移学习网络中,重新对网络进行训练,提高目标领域的识别率。
2.如权利要求1所述的基于最大均值差异的负迁移样本筛选方法,其特征在于,所述步骤2中深度迁移学习网络包括源领域和目标领域,所述源领域和目标领域分别由4个叠加的卷积层、3个全连接层通信连接。
3.如权利要求1所述的基于最大均值差异的负迁移样本筛选方法,其特征在于,所述步骤3的过程为:
假定在(0,B)范围内作出接受的决策,假定大于B,作出拒绝的决策;
对接受的批次数据的权值进行更新,将权值增加1,得到更新后的权值
B表示MMD阈值,B=(2K/m)1/2。
4.如权利要求1所述的基于最大均值差异的负迁移样本筛选方法,其特征在于,步骤5的具体过程为:
将源领域的负迁移本剔除,然后再将其放入深度迁移网络中训练,通过梯度下降法使损失最小,提高目标领域的分类识别精度。
5.如权利要求1所述的基于最大均值差异的负迁移样本筛选方法,其特征在于,所述步骤4的临界值设定为源领域样本的80%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北华中电力科技开发有限责任公司,未经湖北华中电力科技开发有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010284561.4/1.html,转载请声明来源钻瓜专利网。