[发明专利]防止隐私数据泄漏的编码模型训练方法及装置有效
申请号: | 202110440032.3 | 申请日: | 2019-12-09 |
公开(公告)号: | CN113159288B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 石磊磊;熊涛 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62;G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 防止 隐私 数据 泄漏 编码 模型 训练 方法 装置 | ||
本说明书实施例提供一种编码模型训练方法,该方法包括:首先,获取多个训练样本,其中每个训练样本包括表征对应目标对象身份信息的隐私数据和对象标识;然后,将多个训练样本分别输入编码模型中,得到多个特征向量;接着,将多个特征向量分别输入用于确定目标对象身份的分类模型、用于反推隐私数据的解码模型和用于区分不同目标对象的区分模型,以对应确定分类损失、解码损失和区分损失;再然后,以最大化分类损失和解码损失,以及最小化区分损失为目标,对编码模型调参。此外,还披露一种目标对象身份识别方法,利用训练好的编码模型对采集的隐私数据进行编码,并对得到的特征向量进行传输、存储和比对使用。如此,可以有效防止隐私数据的泄漏。
本申请为2019年12月9日提交的申请号为201911252327.7,名为“防止隐私数据泄漏的编码模型训练方法及装置”的发明专利申请的分案申请。
技术领域
本说明书一个或多个实施例涉及将机器学习应用于数据安全的技术领域,尤其涉及一种防止隐私数据泄漏的编码模型训练方法及装置、一种防止隐私数据泄漏的目标对象身份识别方法。
背景技术
在许多场景下,都涉及通过采集目标对象(如用户或设备等)的隐私数据,来对该目标对象进行身份识别或身份核验。例如,在人脸支付场景下,可以通过采集用户的人脸信息,识别该用户的身份(如支付系统中的用户ID),以根据该身份查找到对应支付账户,完成相应订单的支付。又例如,在用户行为分析场景下,可以通过采集终端设备在使用过程中产生的传感器数据等,识别该设备的身份(如数据分析系统为该设备分配的设备ID),以建立用户与设备之间的映射关系。显然,这些场景下,对身份识别的准确性都提出较高的要求。
然而,在以上身份识别过程中涉及的针对隐私数据的采集、传输、存储和使用环节,均存在隐私数据泄漏的风险。因此,迫切需要一种合理、可靠的方案,可以在保证针对目标对象进行身份识别的准确性的同时,有效降低隐私数据泄漏的风险。
发明内容
本说明书一个或多个实施例描述了一种防止隐私数据泄漏的编码模型训练方法及装置,以及一种防止隐私数据泄漏的目标对象身份识别方法及装置,可以在保证针对目标对象进行身份识别的准确性的同时,有效降低隐私数据泄漏的风险。
根据第一方面,提供一种防止隐私数据泄漏的编码模型训练方法,该方法包括:获取多个训练样本组,包括任意的第一样本组,所述第一样本组包括第一样本对和第二样本对,所述第一样本对包括第一训练样本和第二训练样本,其中第一训练样本包括表征第一目标对象身份信息的第一隐私数据和第一对象标识;所述第二训练样本具有所述第一对象标识,所述第二样本对的两个样本具有不同对象标识;将所述第一样本组中各训练样本对应的隐私数据分别输入编码模型,得到对应的多个特征向量,其中包括对应于所述第一训练样本的第一特征向量;将所述第一特征向量输入用于确定目标对象身份的分类模型,得到第一分类结果,基于所述第一分类结果和所述第一对象标识,确定第一分类损失;将所述第一特征向量输入用于反推隐私数据的解码模型,得到第一反推数据,基于所述第一反推数据和所述第一隐私数据,确定第一解码损失;将所述第一样本组中各训练样本对应的特征向量输入用于区分不同目标对象的区分模型,得到所述第一样本对中样本之间的第一样本距离,以及第二样本对中样本之间的第二样本距离,并且,确定第一区分损失,所述第一区分损失与所述第一样本距离正相关,且与所述第二样本距离负相关;以最大化所述多个训练样本组对应的分类损失和解码损失,以及最小化所述多个训练样本对应的区分损失为目标,调整所述编码模型中的模型参数。
在一个实施例中,所述目标对象包括用户,所述身份信息包括以下中的一种或多种:人脸图像、指纹图像、虹膜图像。
在一个实施例中,所述目标对象包括设备,所述身份信息包括以下中的一种或多种:国际移动设备识别码IMEI、用户识别卡SIM的卡号、设备传感器信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110440032.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置