[发明专利]弱监督机器学习优化方法、装置、设备及存储介质在审
申请号: | 202010084922.0 | 申请日: | 2020-02-10 |
公开(公告)号: | CN111325320A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 魏锡光;李权;鞠策;曹祥;刘洋;陈天健;高大山 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张婷 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 机器 学习 优化 方法 装置 设备 存储 介质 | ||
本发明公开了一种弱监督机器学习优化方法、装置、设备及存储介质,所述方法包括:对待训练模型进行有监督训练以更新待训练模型的第一编码器和第一预测器,得到对应的第二编码器和第二预测器;锁定第二编码器中与有监督训练相关的部分结构,对待训练模型进行自监督训练以更新第二编码器的未锁定部分结构,得到第三编码器;锁定第三编码器,对待训练模型进行有监督训练以更新第二预测器,以得到与待训练模型对应的目标模型。本发明实现了即使训练过程中仅使用少量的有标签样本,也能够训练得到预测效果很好的目标模型,从而降低了机器学习模型的训练成本,提高了模型训练效率。
技术领域
本发明涉及人工智能领域,尤其涉及一种弱监督机器学习优化方法、装置、设备及存储介质。
背景技术
随着人工智能技术的发展,机器学习也越来越多地被应用于各个领域。现今的机器学习通常需要大量的带标签数据训练机器学习模型才能够获得好的模型预测效果,训练数据可能很容易获得,而打标签则需要专门的人力完成,导致模型训练成本高、训练效率低。因此通常会面临有标签的数据比较少,而无标签数据比较多的情况,从而导致机器学习无法获得很好的模型预测效果,因此,弱监督机器学习是目前业界的一个研究方向。
现有的基于自编码解码器的弱监督机器学习方法虽然能够实现采用少量的有标签数据进行机器学习,但是这种方法未考虑自监督的随机性,自监督学习可能会破坏有监督学习的成果,导致训练得到的模型预测效果并不好。因此,如何采用少量的标签数据即可训练得到预测效果很好的模型,以降低模型训练成本、提高训练效率,成为了一个亟待解决的问题。
发明内容
本发明的主要目的在于提供一种弱监督机器学习优化方法、装置、设备及存储介质,旨在解决如何采用少量的标签数据即可训练得到预测效果很好的模型,以降低模型训练成本、提高训练效率的问题。
为实现上述目的,本发明提供一种弱监督机器学习优化方法,所述弱监督机器学习优化方法包括以下步骤:
对待训练模型进行有监督训练以更新所述待训练模型的第一编码器和第一预测器,得到对应的第二编码器和第二预测器;
锁定所述第二编码器中与有监督训练相关的部分结构,对所述待训练模型进行自监督训练以更新所述第二编码器的未锁定部分结构,得到第三编码器;
锁定所述第三编码器,对所述待训练模型进行有监督训练以更新所述第二预测器,基于所述第三编码器和更新后的第二预测器得到与所述待训练模型对应的目标模型。
可选地,所述对待训练模型进行有监督训练以更新所述待训练模型的第一编码器和第一预测器,得到对应的第二编码器和第二预测器的步骤包括:
调用所述第一编码器对用于训练所述待训练模型的第一有标签样本进行特征提取,得到第一预测特征;
调用所述第一预测器对所述第一预测特征进行预测处理,得到第一预测标签;
根据所述第一预测标签和所述第一有标签样本的真实标签计算第一有监督损失函数,并根据所述第一有监督损失函数更新所述第一编码器和所述第一预测器,循环更新至少一个世代后得到对应的第二编码器和第二预测器。
可选地,所述锁定所述第二编码器中与有监督训练相关的部分结构,对所述待训练模型进行自监督训练以更新所述第二编码器的未锁定部分结构,得到第三编码器的步骤包括:
锁定所述第二编码器中与所述第一预测特征相关的部分结构;
调用所述第二编码器对用于训练所述待训练模型的无标签样本进行特征提取,得到第二预测特征和第一增广特征;
调用所述待训练模型的解码器对所述第二预测特征和所述第一增广特征进行解码处理,得到解码数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010084922.0/2.html,转载请声明来源钻瓜专利网。