[发明专利]一种自适应的不平衡数据领域适应方法有效
申请号: | 202010582064.2 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111753899B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 朱毅;李云;强继朋;袁运浩 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/2415;G06F18/2136 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;陈栋智 |
地址: | 225000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 不平衡 数据 领域 适应 方法 | ||
1.一种自适应的不平衡数据领域适应方法,其特征在于,包括以下步骤:
步骤1)构建叠加稀疏自编码机,学习源领域和目标领域的原始图像数据集的向量表示;
步骤2)针对源领域和目标领域的不平衡数据,构建自适应的不平衡数据领域适应目标函数,补偿数量较小的类损失,并应用最大均值差异算法将源领域和目标领域的大量无标签数据信息代入领域适应目标函数,缩小源领域和目标领域的距离;
步骤3)用逻辑回归模型在训练集上训练分类器,并在测试集上做分类预测,得到最终的领域适应结果。
2.根据权利要求1所述的一种自适应的不平衡数据领域适应方法,其特征在于,所述步骤1)具体包括:
步骤1-1)将源领域DS的图像数据表示为有标签数据和无标签数据目标领域DT的图像数据表示为有标签数据和无标签数据数据表示为标签表示为是源领域中有标签数据和无标签数据的数量,是目标领域中有标签数据和无标签数据的数量,构建叠加稀疏自编码机,用x表示源领域和目标领域的数据并作为输入,叠加稀疏自编码机的目标函数如公式(1)所示:
公式(1)中,第一项中的表示叠加稀疏自编码机的输出,可以表示为而ξsparse=f(Wsparse,1x+bsparse,1),f是非线性的激活函数,Wsparse和bsparse是稀疏自编码机编码层和解码层的权重矩阵的偏置向量,第二项中的β是控制稀疏惩罚项权重的超参数,s表示隐藏层节点的数量,是用以做稀疏惩罚项的KL距离,其中p是稀疏参数,是隐藏层节点r的平均激活值;
步骤1-2)迭代求解叠加稀疏自编码机,学习源领域和目标领域的原始图像数据集的向量表示,Jsparse关于权重矩阵W和偏置向量b的偏导数计算公式如下:
其中δ(l+1)表示叠加稀疏自编码机关于第l+1层输出zi(l+1)的偏导,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010582064.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置