[发明专利]模型训练方法、服务评估方法、装置、设备及存储介质在审
申请号: | 202210939512.9 | 申请日: | 2022-08-05 |
公开(公告)号: | CN115186767A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 蔡晓娟;卞阳;邢旭;陈立峰 | 申请(专利权)人: | 富算科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 200135 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 服务 评估 装置 设备 存储 介质 | ||
本申请提供一种模型训练方法、服务评估方法、装置、设备及存储介质,该方法包括:根据至少两方的样本数据,计算至少两方所共有的相似矩阵样本数据包括有标签数据和无标签数据;根据相似矩阵,计算每一个样本数据对应的置信度;根据每一个样本数据的置信度以及类标签信息确定多个弱分类器所分别对应的弱分类器权重以及弱分类函数;根据各个弱分类器权重以及弱分类函数,更新得到强分类器所对应的强分类函数。本申请所提供的模型训练方法,考虑到了样本间的距离,提高了获得的服务模型的性能。
技术领域
本申请涉及机器学习领域,具体而言,涉及一种模型训练方法、服务评估方法、装置、设备及存储介质。
背景技术
半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习同时使用标记数据和大量的未标记数据来进行模式识别工作。
提升方法是一种常用的统计学习方法。在分类问题中,它可以通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。
目前在半监督联邦学习中,常采用神经网络模型,直接在迭代过程中对样本进行预测,但是神经网络模型的训练需要大量的训练样本,对于样本数量有限的情况下,其训练获得的联邦学习模型的性能较差。
发明内容
本申请实施例的目的在于提供一种模型训练方法、服务评估方法、装置、设备及存储介质,用以提高训练获得的模型的性能。
第一方面,本申请实施例提供了一种模型训练方法,其应用于联邦学习场景,该方法包括:根据至少两方的样本数据,计算所述至少两方所共有的相似矩阵;所述相似矩阵表征所述至少两方的样本数据之间的相似关系;所述样本数据包括有标签数据和无标签数据;且,所述样本数据包括多个用户分别对应的预设的用户信息;所述有标签数据对应的类标签信息用于表征是否为对应的用户提供服务;根据所述相似矩阵,计算每一个样本数据对应的置信度;所述置信度包括样本数据为有标签数据的第一概率以及样本数据为无标签数据的第二概率;根据每一个样本数据的置信度以及类标签信息确定多个弱分类器所分别对应的弱分类器权重以及弱分类函数;根据各个弱分类器权重以及弱分类函数,更新得到强分类器所对应的强分类函数;其中,所述弱分类器和所述强分类器均用于预测是否为用户提供服务,且所述强分类器的预测准确性高于所述弱分类器的预测准确性。这样,可以使用无标签样本数据进行相关计算,解决了相关技术中存在的训练获得的模型性能差的问题;并且可以基于相似矩阵减少样本数据的需求量,基于提升方法提升可解释性,基于置信度将无标签数据排除在当前训练过程之外,避免了干扰因素。继而,该方法改善了相关技术中存在的联邦学习场景下的监督或者半监督学习方法中的不足,具有更强的实用性。
可选地,所述根据至少两方的样本数据,计算所述至少两方所共有的相似矩阵,包括:根据至少两方的样本数据,确定所述至少两方的样本数据之间的欧式距离;根据所述欧式距离,计算所述至少两方所共有的相似矩阵。这样,能够使样本数据之间的相似关系更加直观,易于实现。
可选地,所述联邦学习场景包括纵向学习场景,所述纵向学习场景中的任意一方的样本数据至少包括2个,以及所述根据至少两方的样本数据,确定所述至少两方的样本数据之间的欧式距离,包括:根据己方每一个样本数据所对应的己方特征值,确定任意两个己方特征值之间的差值;根据任意两个己方特征值之间的差值,确定己方特征差值所对应的己方平方和;接收对方平方和;所述对方平方和表征对方特征差值所对应的平方和;所述对方特征差值表征任意两个对方样本数据对应的对方特征值之间的差值;计算所述己方平方和以及所述对方平方和所对应的累加和的二次方根,得到所述欧式距离。这样,通过发送各参与方所对应的对方平方和,保证了对方的数据安全,继而可以应用于纵向学习场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富算科技(上海)有限公司,未经富算科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210939512.9/2.html,转载请声明来源钻瓜专利网。