[发明专利]面向差分隐私保护的随机森林算法在审

专利信息
申请号: 201811044646.4 申请日: 2018-09-07
公开(公告)号: CN109284626A 公开(公告)日: 2019-01-29
发明(设计)人: 李远航;陈先来;安莹;刘莉 申请(专利权)人: 中南大学
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62
代理公司: 长沙永星专利商标事务所(普通合伙) 43001 代理人: 周咏;林毓俊
地址: 410083 湖南省长沙市岳*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 随机森林 隐私保护 算法 信息增益 偏好 分类准确率 分类结果 机器学习 离散属性 连续属性 输出测试 隐私信息 测试集 分类树 决策树 分类 基尼 样本 分裂
【权利要求书】:

1.一种面向差分隐私保护的随机森林算法,其特征在于,包括以下步骤:

步骤一、建立提供ε-差分隐私保护的随机森林;

步骤二、利用提供ε-差分隐私保护的随机森林对测试集进行分类,输出测试集中所有样本的分类结果。

2.根据权利要求1所述面向差分隐私保护的随机森林算法,其特征在于,步骤一中,所述建立提供ε-差分隐私保护的随机森林,具体为:

1.1)获取数据集:若数据集中已经区分训练集D和测试集Test,则执行下一步;否则,采用十折交叉验证得到训练集D和测试集Test;

1.2)数据预处理:对缺失数据进行删除,记录每个特征及其标签(离散/连续),形成特征集F和特征集标签Flag;

1.3)设置隐私预算B,决策树的数量T,每棵树的最大深度d,每个节点选择的特征个数m,其中(向上取整,即不小于自己的最小整数),|F|为特征集F中包含的特征数量;

1.4)确定随机森林中的决策树类型、分裂准则、打分函数q(Di,A)和打分函数的全局敏感度Δq;

1.5)建立提供ε-差分隐私保护的随机森林:

输入:训练数据集D,特征集F,特征集标签Flag,隐私预算B,决策树的数量T,每棵树的最大深度d,每个节点选择的特征个数m;

停止条件:节点上的全部样本分类一致,或者达到最大深度d;

输出:提供ε-差分隐私保护的随机森林。

3.根据权利要求2所述面向差分隐私保护的随机森林算法,其特征在于,所述步骤1.4)中,采用的决策树类型是CART分类树,分裂准则是基尼指数,打分函数是基尼指数,全局敏感度是2。

4.根据权利要求2所述面向差分隐私保护的随机森林算法,其特征在于,所述步骤1.5)中,建立提供ε-差分隐私保护的随机森林的算法程序为:

(1)

(2)

(3)for t=1to T;

1)使用自助采样法从D中选取大小为|D|的训练集Di

2)递归执行以下步骤建立随机森林中的决策树RFTt

(i)计算当前节点训练集Dcur中的样本数量,使用Laplace机制添加噪声:

(ii)判断节点是否达到停止条件,如果达到停止条件,则设置当前节点为叶子节点,并对当前节点进行分类,返回分类结果;否则,继续以下步骤;

(iii)随机地从特征集F中选取m个特征;

(iv)若选取的特征中含有连续属性,使用二分法对连续特征离散化;

(v)使用指数机制从m个特征中,用以下概率选择分裂特征:

其中,A是选择的特征,q(Di,A)是打分函数,Δq是打分函数的全局敏感度;

(vi)根据特征集标签Flag和分裂特征的不同取值对特征取值进行划分,选择使得分裂准则最佳的值,记录最佳分裂特征和特征取值,将当前节点分裂为2个子节点,每个子节点分别执行步骤(i)~(vi);

(4)返回树的集合即提供ε-差分隐私保护的随机森林。

5.根据权利要求1所述面向差分隐私保护的随机森林算法,其特征在于,步骤二中,所述利用提供ε-差分隐私保护的随机森林对测试集进行分类,具体为:

输入:测试集Test,提供ε-差分隐私保护的随机森林;

输出:测试集中所有样本的分类结果。

6.根据权利要求5所述面向差分隐私保护的随机森林算法,其特征在于,所述利用提供ε-差分隐私保护的随机森林对测试集进行分类的算法程序为:

(1)取出测试集中的每个样本x,执行步骤(2)和(3);

(2)for t=1to T;

1)从当前决策树的根节点开始,根据当前节点记录的最佳分裂特征和特征取值,判断进入哪个子节点,一直递归下去,直到到达某个叶子节点;

2)得到当前决策树下的分类结果Ct(x);

(3)根据每棵决策树的分类结果得到即样本x的分类结果是所有树分类结果的众数;

(4)输出测试集中所有样本的分类结果集合{C(x)}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811044646.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top