[发明专利]一种基于无监督聚类和度量学习的迁移学习方法有效
申请号: | 201711447557.X | 申请日: | 2017-12-27 |
公开(公告)号: | CN108197643B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 易长安;顾艳春;王东;李晓东;胡小生;何志敏 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 度量 学习 迁移 学习方法 | ||
1.一种基于无监督聚类和度量学习的迁移学习方法,其特征在于,包括以下步骤:
S1、准备源域样本DS和目标域样本DT;
S2、使用主成份分析方法降低全部样本的维度;
S3、对源域样本DS进行无监督聚类,将源域样本聚为多个类别,本质相似的样本聚在一起;
S4、为每个聚类学习一个度量矩阵G;
S5、通过每个聚类和所有的度量矩阵的关联性得出权重矩阵w0;
S6、根据已知标签的目标域样本DTL训练权重矩阵w0,得到最优的权重矩阵W;
S7、根据权重矩阵W预测未知标签的目标域样本DTU的标签;
所述步骤S6的具体过程如下:
S61、求出每个已知标签的目标域样本DTL的所属聚类Ci;
S62、使用每个度量矩阵进行预测,若结果与真实标签相同,则不需要调整,若结果与真实标签不相同,则调整聚类Ci和该度量矩阵所对应元素的权重;直至所有已知标签的目标域样本DTL均已测试;
S63、若经所有已知标签的目标域样本DTL测试后的权重矩阵w0满足收敛条件,则训练结束,该权重矩阵即为最优的权重矩阵W;否则继续使用DTL更新权重矩阵,直至满足收敛条件为止。
2.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4每个聚类在学习一个度量矩阵之前均需要将样本的顺序打乱。
3.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S4学习度量矩阵G之前需设置收敛条件:
||G-G0||<Lamda,其中,G0为度量矩阵G的初始值,将初始值设置为对称单位矩阵,Lamda为设定的阈值,||G-G0||表示G和G0之间距离;
求解度量矩阵G的目标函数的公式如下:
subject to dG(xi,xj)≤α,xi,xj∈S,
dG(xi,xj)≥β,xi,xj∈D
其中,xi、xj指其中的某个样本,S表示xi与xj同类,D表示xi与xj不同类;p(x;G)表示度量矩阵G下的样本x的概率分布;p(x;G0)表示度量矩阵G0下的样本x的概率分布;α和β为设定的阈值。
4.根据权利要求3所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述阈值α和β的设置方式为:从训练集里任意选取100个样本对,并且将样本两两之间的距离按从小到大的顺序排列,排第5的距离值为α,排第95的距离值为β。
5.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述权重矩阵w0满足收敛条件后,对于w0的每个元素wij,1≤i,j≤n,n为聚类数目,均执行归一化操作。
6.根据权利要求1所述的一种基于无监督聚类和度量学习的迁移学习方法,其特征在于:所述步骤S7的具体过程如下:
S71、求出每个未知标签的目标域样本DTU各自所属的聚类Ct;
S72、使用全部的度量矩阵预测样本i的类型;
S73、使用KNN分类器进行分类得出分类值;
S74、若分类值大于阈值threshold,则预测样本i的标签值为Label1,否则预测样本i的标签值为Label2,Label1大于Label2;其中,
threshold=(Label1-Label2)/NumOfCategory,NumOfCategory为标签种类数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711447557.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种印章鉴别方法及装置
- 下一篇:一种图像识别方法和装置