[发明专利]多方联合确定隐私数据中对象特征相关性的方法及装置在审
申请号: | 202110084215.6 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112818290A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 刘颖婷;陈超超;谭晋;王力 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多方 联合 确定 隐私 数据 对象 特征 相关性 方法 装置 | ||
本说明书实施例提供一种多方联合确定隐私数据中对象特征相关性的方法及装置。隐私数据分布在多个持有方中,第一持有方针对第一原始矩阵中多项特征的特征值进行零均值化,得到第一中心矩阵;利用多方安全计算,基于第一中心矩阵以及其他持有方各自的中心矩阵,确定协方差矩阵的第一分片矩阵。针对第一持有方中的第i特征与第二持有方中的第j特征,第一持有方从本地的协方差矩阵分片、本地存储的特征数据中获取数据,并利用多方安全计算,基于第二持有方的本地特征数据,确定第i特征与第j特征之间的第一相关性系数分片。
技术领域
本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及多方联合确定隐私数据中对象特征相关性的方法及装置。
背景技术
在现实领域构建线性模型的过程中,会出现一些样本特征与其他样本特征相关的情况,即特征或变量的多重共线性,也就是样本特征之间存在较高的相关性。当这种情况较严重时,会增大模型中回归系数的方差,使回归模型的结果变得不稳定。而在多平台联合建模场景中,由于多方共同建模,所使用的样本数据产生于相似场景,其难免会产生命名不同的共线特征,因此在构建线性模型之前对特征之间的相关性进行检验并处理,是十分必要的。而各平台中的样本数据往往存在较强的隐私保护需求,不会以明文或者简单的密文形式传输。当前存在对不同平台中样本数据的特征之间的相关性进行评估的需求。
因此,希望能有改进的方案,可以更加安全、有效地确定多方隐私数据中特征之间的相关性,同时保证隐私数据的安全不泄露。
发明内容
本说明书一个或多个实施例描述了多方联合确定隐私数据中对象特征相关性的方法及装置,以更加安全、有效地确定多方隐私数据中特征之间的相关性,同时保证隐私数据的安全不泄露。具体的技术方案如下。
第一方面,一种多方联合确定隐私数据中对象特征之间相关性的方法,所述隐私数据分布在多个持有方中,其中任意的第一持有方存储有n个业务对象针对若干个特征的特征值构成的第一原始矩阵;所述方法通过所述第一持有方执行,包括:
针对所述第一原始矩阵中多项特征的特征值进行零均值化,得到第一中心矩阵;
利用多方安全计算(Secure Multi-party Computation,MPC),基于所述第一中心矩阵以及其他持有方各自的中心矩阵,确定协方差矩阵的第一分片矩阵;其中,所述协方差矩阵基于联合矩阵得到;多个持有方各自对应的中心矩阵在假定相拼接的情况下,构成所述联合矩阵;多个持有方各自的分片矩阵在假定重构的情况下,构成所述协方差矩阵;
针对所述第一持有方中的第i特征与第二持有方中的第j特征,基于所述第一分片矩阵、所述第一中心矩阵以及所述第二持有方的第二中心矩阵,利用多方安全计算,确定所述第i特征与所述第j特征之间的第一相关性系数分片,以用于与所述第二持有方确定的第二相关性系数分片合成完整的相关性系数。
在一种实施方式中,方法还包括:在需要确定所述第i特征与所述第j特征之间完整的相关性系数时,从所述第二持有方获取对应的第二相关性系数分片,基于所述第一相关性系数分片和所述第二相关性系数分片的和,得到所述第i特征与所述第j特征之间完整的相关性系数。
在一种实施方式中,方法还包括:在得到所述相关性系数之后,根据所述相关性系数与预设阈值的比较,确定针对所述第i特征和所述第j特征的处理操作,所述处理操作包括以下之一:删除特征、融合特征。
在一种实施方式中,方法还包括:对所述第一原始矩阵中所述第i特征对应的特征值执行所述处理操作,得到更新后的业务数据矩阵,用以通过机器学习的方式对业务对象进行业务预测分析。
在一种实施方式中,多个持有方的原始矩阵中所述n个业务对象的数据按照预定顺序排列,不同持有方存储有多个业务对象的不同特征的特征值;所述业务对象为以下之一:用户、商铺、商品、事件。
在一种实施方式中,所述确定协方差矩阵的第一分片矩阵的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110084215.6/2.html,转载请声明来源钻瓜专利网。