[发明专利]基于成对样本匹配的迁移学习方法有效
申请号: | 201910849336.8 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110555060B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 高赞;李荫民;程志勇;陈达;舒明雷;聂礼强 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/214;G06N3/0464;G06N3/0442 |
代理公司: | 山东知圣律师事务所 37262 | 代理人: | 黄学国 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成对 样本 匹配 迁移 学习方法 | ||
1.一种基于成对样本匹配的迁移学习方法,用于挖掘不同域样本的内在关联特性,以实现在源域样本辅助下高效率的分类少量目标域样本,其特征在于,包含以下步骤:
第一步、数据预处理
首先从源域中标记的训练数据中随机抽取一幅图像,然后计算所选样本与目标域中相同或不同类别的所有样本之间的相似性,然后,将图像与另一个与目标域距离最近或最远的相同或不同类别的图像配对,形成一个正或负训练实例;对于正的一对,其标签设置为1,对于负的一对,其标签设置为0;
第二步、基于成对样本匹配的双链迁移学习模型构建
将配对后的数据输入到两个权值共享的网络,对于每个网络,它包含一个残差结构,三个卷积层和两个完全连接层,每个卷积层和完全连接层之后都有批量归一化和实例归一化操作和线性整流函数激活,在卷积层和完全连接层之间设置一个2×2的最大池化层来将两者连接,使用对比损失函数和最大均值距离损失函数来连接这两个网络,从而处理样本之间的关系;
第三步、实例归一化和批量归一化
设置x为小批量上的变量,B为小批量m个变量的集合B={x1,2,……m},γ,β为学习的变量,∈是为保证数值稳定性的而添加的常数,小批量均值为ηB,方差为批量归一化以及其线性变换yi公式为:
设置一个朱尔兹集合函数J:Ω→R3,其离散晶格Ω={1,…,H}×{1,…,W},实例归一化ytijk公式为:
其中x∈R,T×C×W×H为包含一批C维T图像的输入张量,其宽和高分别为W和H,ε是为保证数值稳定性的而添加的常数;设xtijk为其第tijk个元素,其中k和j张成空间维度,i为特征通道,如果输入为RGB图像,则为彩色通道,t为图像批的索引;ηti和别为t索引和i特征通道上x的均值和方差;
第四步、计算对比损失和最大均值距离损失
对比损失LE设计为:
其中N为批次大小,yn为第n对样本的目标标号(0或1),margin为当前批次的最大距离边界,dn为两对样本之间的欧式距离;选择分类交叉熵作为分类损失函数,其公式Lc是:
其中p为归一化指数函数的预测,t为目标向量,C为类别数,x为目标样本,y为x的标签;
此外,将最大均值距离LMMD添加到模型中:
其中m,n分别为数据集x,y的大小,φ(·)表示与内核相关的功能映射图,k(x,y)=φ(x),φ(y),k(x,y)通常定义为l基核kl(x,y)的凸组合,公式为:
其中βl为l基核的参数,L为基核总数;
综上所述,模型的总损失函数为:
L=αLc+βLE+γLMMD
α,β,γ代表加权变量,Lc代表分类交叉熵损失函数,LE为对比损失函数,LMMD为最大均值距离损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910849336.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用于智能楼宇的协调系统
- 下一篇:轨迹相似度确定方法和装置