[发明专利]基于差分隐私的异常检测模型的训练方法及装置在审
申请号: | 202010343419.2 | 申请日: | 2020-04-27 |
公开(公告)号: | CN111539769A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 熊涛 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 异常 检测 模型 训练 方法 装置 | ||
本说明书实施例提供一种基于差分隐私的异常检测模型的训练方法,包括:将训练集中任意样本的第一向量输入自编码网络,通过编码器输出降维的第二向量,通过解码器输出复原的第三向量。然后,基于第二向量构建评估向量,输入到评估网络,并获取评估网络输出的该样本属于混合高斯分布中K个子高斯分布的子分布概率。然后,根据训练集中各样本对应的评估向量和子分布概率,得到该任意样本在混合高斯分布中的第一概率。据此确定预测损失,其与各样本对应的第一概率负相关,且与第一向量和第三向量之间的相似度负相关。进而,利用差分隐私的方式,在基于预测损失得到的原始梯度上添加噪声,利用包含噪声的梯度,调整异常检测模型的模型参数。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及通过计算机执行的基于差分隐私的异常检测模型的训练方法和装置。
背景技术
随着计算机技术的发展,安全性成为日益关注的问题,例如计算机数据的安全性,电子支付的交易安全性,网络访问的安全性,等等。为此,在许多场景下,需要从大量样本中发现有可能影响安全性的异常样本,并针对这些异常样本采取措施。
例如,希望从大量交易操作样本中发现异常交易操作,从而提前防范欺诈交易;希望从网络访问的样本中检测异常访问,从而发现不安全的访问,例如黑客攻击;希望从进行各种操作的用户账户中发现异常账户,从而锁定涉嫌进行高风险操作(欺诈交易、刷单等虚假交易、网络攻击)的账户;希望从大量权益领取操作(例如,领取营销红包、奖励金、优惠券等操作)中发现异常操作,从而防范恶意领取优惠权益的“黑产”操作,等等。
然而,在许多情况下,异常样本的标定非常耗费时间和人力,并且通常异常样本的数量较少,这使得常规典型的有监督学习方法难以发挥作用。因此,提出了一些无监督的方式,试图从大量样本中检测出异常样本。无监督的异常检测通常是基于样本的分布概率或密度估计,从统计意义上寻找出偏离多数常规样本的那些离群样本,作为异常样本。
然而,现有的无监督异常检测模型,往往存在泄露训练样本的风险,以及因为过拟合造成的鲁棒性不足,泛化能力不足的缺点。因此,希望能有改进的方案,能够得到更为安全、更为有效的异常检测模型。
发明内容
本说明书一个或多个实施例描述了一种基于差分隐私的异常检测模型的训练方法,用以得到保护隐私且具有鲁棒性的异常检测模型。
根据第一方面,提供了一种基于差分隐私的异常检测模型的训练方法,所述异常检测模型包括自编码网络和评估网络,所述自编码网络包括编码器和解码器;所述方法包括:
将训练集中任意业务样本对应的第一特征向量输入所述自编码网络,通过所述编码器输出对所述第一特征向量降维的第二特征向量,通过所述解码器输出基于所述第二特征向量对所述第一特征向量进行复原的第三特征向量;
基于所述第二特征向量,构建评估向量,输入所述评估网络;
获取所述评估网络输出的该任意业务样本属于混合高斯分布中K个子高斯分布的子分布概率;
根据所述训练集中各个业务样本对应的所述评估向量和所述子分布概率,得到该任意业务样本在所述混合高斯分布中的第一概率;
确定所述训练集对应的预测损失,所述预测损失与所述各个业务样本对应的所述第一概率负相关,且与所述各个业务样本对应的第一特征向量和第三特征向量之间的相似度负相关;
利用差分隐私的方式,在基于所述预测损失得到的原始梯度上添加噪声,利用包含噪声的梯度,调整所述异常检测模型的模型参数。
在一个实施例中,所述评估向量即为所述第二特征向量。
在另一实施例中,评估向量通过以下方式构建:基于所述第一特征向量和所述第三特征向量,得到重构误差向量;将所述第二特征向量和所述重构误差向量相组合,作为所述评估向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010343419.2/2.html,转载请声明来源钻瓜专利网。