[发明专利]基于成对样本匹配的迁移学习方法有效

申请号：	201910849336.8	申请日：	2019-09-09
公开（公告）号：	CN110555060B	公开（公告）日：	2023-05-02
发明（设计）人：	高赞;李荫民;程志勇;陈达;舒明雷;聂礼强	申请（专利权）人：	山东省计算中心（国家超级计算济南中心）
主分类号：	G06F16/2458	分类号：	G06F16/2458;G06F18/214;G06N3/0464;G06N3/0442
代理公司：	山东知圣律师事务所 37262	代理人：	黄学国
地址：	250014 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于成对样本匹配迁移学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于成对样本匹配的迁移学习方法，用于挖掘不同域样本的内在关联特性，以实现在源域样本辅助下高效率的分类少量目标域样本，其特征在于，包含以下步骤：

第一步、数据预处理

首先从源域中标记的训练数据中随机抽取一幅图像，然后计算所选样本与目标域中相同或不同类别的所有样本之间的相似性，然后，将图像与另一个与目标域距离最近或最远的相同或不同类别的图像配对，形成一个正或负训练实例；对于正的一对，其标签设置为1，对于负的一对，其标签设置为0；

第二步、基于成对样本匹配的双链迁移学习模型构建

将配对后的数据输入到两个权值共享的网络，对于每个网络，它包含一个残差结构，三个卷积层和两个完全连接层，每个卷积层和完全连接层之后都有批量归一化和实例归一化操作和线性整流函数激活，在卷积层和完全连接层之间设置一个2×2的最大池化层来将两者连接，使用对比损失函数和最大均值距离损失函数来连接这两个网络，从而处理样本之间的关系；

第三步、实例归一化和批量归一化

设置x为小批量上的变量，B为小批量m个变量的集合B＝{x_{1，2，……m}}，γ，β为学习的变量，∈是为保证数值稳定性的而添加的常数，小批量均值为η_B，方差为批量归一化以及其线性变换y_i公式为：

设置一个朱尔兹集合函数J:Ω→R³，其离散晶格Ω＝{1,…,H}×{1,…，W}，实例归一化y_tijk公式为：

其中x∈R，T×C×W×H为包含一批C维T图像的输入张量，其宽和高分别为W和H，ε是为保证数值稳定性的而添加的常数；设x_tijk为其第tijk个元素，其中k和j张成空间维度，i为特征通道，如果输入为RGB图像，则为彩色通道，t为图像批的索引；η_ti和别为t索引和i特征通道上x的均值和方差；

第四步、计算对比损失和最大均值距离损失

对比损失L_E设计为:

其中N为批次大小，y_n为第n对样本的目标标号(0或1)，margin为当前批次的最大距离边界，d_n为两对样本之间的欧式距离；选择分类交叉熵作为分类损失函数，其公式L_c是:

其中p为归一化指数函数的预测，t为目标向量，C为类别数，x为目标样本，y为x的标签；

此外，将最大均值距离L_MMD添加到模型中:

其中m,n分别为数据集x,y的大小,φ(·)表示与内核相关的功能映射图，k(x,y)＝φ(x)，φ(y)，k(x,y)通常定义为l基核k_l(x,y)的凸组合，公式为：

其中β_l为l基核的参数,L为基核总数；

综上所述，模型的总损失函数为:

L＝αL_c+βL_E+γL_MMD

α，β，γ代表加权变量，L_c代表分类交叉熵损失函数,L_E为对比损失函数，L_MMD为最大均值距离损失函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东省计算中心（国家超级计算济南中心），未经山东省计算中心（国家超级计算济南中心）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910849336.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于成对样本匹配的迁移学习方法有效

专利文献下载