[发明专利]一种基于数据打包的隐私保护决策树的样本分类方法在审

专利信息
申请号: 202010817497.1 申请日: 2020-08-14
公开(公告)号: CN111967514A 公开(公告)日: 2020-11-20
发明(设计)人: 陈志立;李娜;张顺;仲红 申请(专利权)人: 安徽大学
主分类号: G06K9/62 分类号: G06K9/62;G06F21/60;G06F21/62;H04L9/00;H04L9/08;H04L9/14;H04L29/06
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230601 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 打包 隐私 保护 决策树 样本 分类 方法
【说明书】:

发明公开了一种基于数据打包的隐私保护决策树的样本分类方法,该方法应用于由n个拥有数据的参与方,两个服务器组成的网络环境中,并包括以下步骤:S1、初始化阶段;S2、参与方发送加密数据阶段;S3、服务器处理加密数据阶段;S4、训练决策树并进行样本分类阶段。本发明应用于多个参与方,允许客户端在自己的密钥下加密他们的数据,并利用数据打包技术有效地减少系统的计算开销和通信开销,从而有效解决决策树的样本分类过程中的隐私保护问题,提高在本地训练好的决策树模型下对样本进行分类的安全性。

技术领域

本发明属于网络与信息安全技术领域,尤其涉及一种基于数据打包的隐私保护决策树的样本分类方法。

背景技术

近年来,机器学习技术已被广泛应用于许多实际应用中,这些技术的发展导致了海量数据的产生,而这些数据往往分布在不同的站点上,这多个站点想要在不透露自身数据的前提下在它们的数据联合上进行数据挖掘。比如,多家机构或公司分别拥有各自的本地样本集,这些机构想要在不公开本地数据的前提下共同训练出一个决策树模型,并根据该模型对本地的测试样本进行分类。于是,许多组织和公司考虑利用云服务器来训练模型并进行样本分类,这要求这些机构把数据外包给云服务器。然而,考虑到各种隐私问题的出现,敏感数据(如医疗记录)需要在外包到云服务器之前进行加密,由云来对加密数据进行处理并训练决策树模型。但是,这样训练出来的模型就是云的资产,用户在拥有新的测试样本集时,需要向云支付一定费用来对测试样本集进行评估和分类。

为了解决上述问题,文献[Privacy preserving decision tree learning overmultiple parties,2007]中提出了一种新的基于ID3算法和Shamir的秘密共享的分布式隐私保护决策树学习算法,目标是以隐私保护的方式在任意数量的参与方之间上构建决策树,而不需要云的参与。但是,这种方法需要参与方进行大量的交互,且在参与方规模较大的情况下,会造成很大的计算开销和通信开销。

发明内容

本发明为克服现有技术的不足之处,提供一种基于数据打包的隐私保护决策树的样本分类方法,以期能解决当前样本分类过程中的隐私保护问题,在用户非交互的环境下提高样本分类的安全性,同时利用数据打包技术有效地减少用户和服务器之间的计算开销和通信开销。

本发明为解决技术问题采用如下方案:

本发明一种基于数据打包的隐私保护决策树的样本分类方法的特点是应用于由n个参与方{P1,P2,...,Pi,...,Pn},一个主服务器C,一个从服务器S以及BCP系统组成的网络环境中;其中,Pi表示第i个参与方;所述第i个参与方Pi的本地样本集记为Ti,则n个参与方的本地样本集记为T,1≤i≤n;所述第i个参与方Pi的本地样本集Ti拥有s个属性,记为{Ai,1,Ai,2,...,Ai,j,...,Ai,s},其中,Ai,j表示本地样本集Ti的第j个属性;1≤j≤s;所述第j个属性Ai,j拥有t个可能的取值{ai,j,1,ai,j,2,...,ai,j,y,...,ai,j,t};其中,ai,j,y表示所述第j个属性Ai,j的第y个取值;1≤y≤t;所述第i个参与方Pi的本地样本集Ti拥有k个类标签,记为{ci,1,ci,2,...,ci,x,...,ci,k},其中,ci,x表示所述本地样本集Ti的第x个类标签;1≤x≤k;所述样本分类方法包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010817497.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top