[发明专利]基于主成分分析和函数机制的差分隐私线性回归方法及系统在审
申请号: | 202210760895.3 | 申请日: | 2022-06-30 |
公开(公告)号: | CN114969829A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 胡学先;李可佳;陈越;魏江宏;杨鸿健;徐阳 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G06N20/00 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成分 分析 函数 机制 隐私 线性 回归 方法 系统 | ||
1.一种基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,包含如下内容:
对训练数据集进行切分,依据训练属性值构建特征矩阵及标签向量,向特征矩阵的协方差矩阵中注入噪声扰动,并基于主成分分析将特征矩阵投影到主成分空间,依据投影矩阵来获取降维数据集;
利用降维数据集进行模型训练,在模型训练的线性回归目标函数中添加噪声扰动,对扰动后的目标函数进行最优化求解来获取模型训练的最优模型参数。
2.根据权利要求1所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,向特征矩阵中注入噪声扰动中,利用对称高斯噪声矩阵作为向协方差矩阵添加扰动的噪声矩阵,通过协方差矩阵和噪声矩阵来获取扰动后的协方差矩阵。
3.根据权利要求1或2所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,基于主成分分析来获取降维数据集中,首先对扰动后的协方差矩阵进行特征值分解,得到特征值和特征向量;然后,确定主成分空间,并通过将特征矩阵投影到主成分空间来获取投影矩阵。
4.根据权利要求3所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,确定主成分空间中,首先,设置指定主成分特征值的比重阈值,依据主成分特征值的累积贡献率是否超过比重阈值来确定目标维度大小;依据目标维度大小来选取特征值对应的特征向量,有选取的特征值对应的特征向量组成主成分空间。
5.根据权利要求4所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,确定目标维度大小的过程表示为:其中,per为累积贡献率,θ为比重阈值,k为待确定的目标维度,为主成分特征值,n为主成分特征值个数。
6.根据权利要求1所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,投影矩阵表示为:其中,X为特征矩阵,为主成分空间;降维数据集由投影矩阵和标签向量拼接而成。
7.根据权利要求1所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,模型训练中,线性回归目标函数展开为二次多项式形式,并在展开的二次多项式形式中添加随机扰动噪声;并对添加扰动噪声的目标函数进行最优求解。
8.根据权利要求7所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,目标函数展开的二次多项式形式表示为:其中,表示模型参数ω的所有S次单项式组成集合,实数表示对应于单项式的系数,表示降维数据集。
9.根据权利要求7所述的基于主成分分析和函数机制的差分隐私线性回归方法,其特征在于,在展开的二次多项式形式中添加的扰动噪声为服从高斯分布的随机噪声。
10.一种基于主成分分析和函数机制的差分隐私线性回归系统,其特征在于,包含:数据处理模块和模型训练模块,其中,
数据处理模块,用于对训练数据集进行切分,依据训练属性值构建特征矩阵及标签向量,向特征矩阵的协方差矩阵中注入噪声扰动,并基于主成分分析将特征矩阵投影到主成分空间,依据投影矩阵来获取降维数据集;
模型训练模块,用于利用降维数据集进行模型训练,在模型训练的线性回归目标函数中添加噪声扰动,对扰动后的目标函数进行最优化求解来获取模型训练的最优模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210760895.3/1.html,转载请声明来源钻瓜专利网。