[发明专利]基于隐私保护的线性回归特征显著性检验方法、装置有效
申请号: | 202011010612.0 | 申请日: | 2020-09-23 |
公开(公告)号: | CN111931241B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 刘颖婷;陈超超;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N20/00;G06F17/16 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 阚传猛;周达 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 保护 线性 回归 特征 显著 检验 方法 装置 | ||
1.一种基于隐私保护的线性回归特征显著性检验方法,包括:
设置回归特征的回归系数在t检验中的原假设为零,各参与方基于多方安全计算的线性回归训练确定t检验中回归系数的估计值和联合矩阵的误差平方和的无偏估计值;
根据第一参与方持有的私有数据构成的第一原始矩阵、第二参与方持有的私有数据构成的第二原始矩阵计算联合矩阵的对称矩阵的第一加法分片和第二加法分片;
基于所述第一加法分片和第二加法分片,两方联合计算隐私保护下的所述对称矩阵的逆矩阵的第一加法分片和第二加法分片;
基于所述逆矩阵的第一加法分片和第二加法分片、所述无偏估计值,第一参与方和第二参与方联合计算所述回归系数的标准差的第一加法分片和第二加法分片;其中,所述计算所述回归系数的标准差的第一加法分片和第二加法分片包括:基于所述逆矩阵的第一加法分片和第二加法分片,第一参与方和第二参与方联合计算所述无偏估计值与逆矩阵相乘的运算结果的第一加法分片和第二加法分片;根据所述相乘的运算结果的第一加法分片和第二加法分,第一参与方和第二参与方联合进行隐私保护平方根倒数算法的计算,得到回归系数的标准差的第一加法分片和第二加法分片;
根据所述回归系数的标准差的第一加法分片和第二加法分片、回归系数的估计值计算回归特征的统计量;
根据所述统计量所对应的P值确定的t检验结果,确定回归特征的显著性检验结果。
2.如权利要求1所述的方法,在t检验中,采用回归系数与所诉回归系数的标准差的商作为统计量t的数值。
3.如权利要求1所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第一原始矩阵和将第二参与方B持有的私有数据构成的第二原始矩阵横向拼接在一起构成的联合矩阵,在联合矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,则特征数,为第一参与方A的特征个数,为第二参与方B的特征个数,为第一参与方A中单个特征的样本数,为第二参与方B中单个特征的样本数。
4.如权利要求1所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第一原始矩阵和将第二参与方B持有的私有数据构成的第二原始矩阵纵向拼接在一起构成的联合矩阵,在联合矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,则特征数,为第一参与方A的特征个数,为第二参与方B的特征个数,为第一参与方A中单个特征的样本数,为第二参与方B中单个特征的样本数。
5.如权利要求3或4所述的方法,所述原始矩阵包括采用下述方式构建生成:
参与方将本地私有数据中的特征按行构成原始矩阵,或者,参与方将本地私有数据中的特征按列构成矩阵,将按列构成矩阵的转置矩阵作为原始矩阵,其中,在原始矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,选自A和B。
6.如权利要求1所述的方法,所述方法还包括:
根据所述回归特征的显著特性检验结果对特征进行筛选,确定适用特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011010612.0/1.html,转载请声明来源钻瓜专利网。