[发明专利]一种基于数据打包的隐私保护决策树的样本分类方法在审
申请号: | 202010817497.1 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111967514A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 陈志立;李娜;张顺;仲红 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/60;G06F21/62;H04L9/00;H04L9/08;H04L9/14;H04L29/06 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 打包 隐私 保护 决策树 样本 分类 方法 | ||
本发明公开了一种基于数据打包的隐私保护决策树的样本分类方法,该方法应用于由n个拥有数据的参与方,两个服务器组成的网络环境中,并包括以下步骤:S1、初始化阶段;S2、参与方发送加密数据阶段;S3、服务器处理加密数据阶段;S4、训练决策树并进行样本分类阶段。本发明应用于多个参与方,允许客户端在自己的密钥下加密他们的数据,并利用数据打包技术有效地减少系统的计算开销和通信开销,从而有效解决决策树的样本分类过程中的隐私保护问题,提高在本地训练好的决策树模型下对样本进行分类的安全性。
技术领域
本发明属于网络与信息安全技术领域,尤其涉及一种基于数据打包的隐私保护决策树的样本分类方法。
背景技术
近年来,机器学习技术已被广泛应用于许多实际应用中,这些技术的发展导致了海量数据的产生,而这些数据往往分布在不同的站点上,这多个站点想要在不透露自身数据的前提下在它们的数据联合上进行数据挖掘。比如,多家机构或公司分别拥有各自的本地样本集,这些机构想要在不公开本地数据的前提下共同训练出一个决策树模型,并根据该模型对本地的测试样本进行分类。于是,许多组织和公司考虑利用云服务器来训练模型并进行样本分类,这要求这些机构把数据外包给云服务器。然而,考虑到各种隐私问题的出现,敏感数据(如医疗记录)需要在外包到云服务器之前进行加密,由云来对加密数据进行处理并训练决策树模型。但是,这样训练出来的模型就是云的资产,用户在拥有新的测试样本集时,需要向云支付一定费用来对测试样本集进行评估和分类。
为了解决上述问题,文献[Privacy preserving decision tree learning overmultiple parties,2007]中提出了一种新的基于ID3算法和Shamir的秘密共享的分布式隐私保护决策树学习算法,目标是以隐私保护的方式在任意数量的参与方之间上构建决策树,而不需要云的参与。但是,这种方法需要参与方进行大量的交互,且在参与方规模较大的情况下,会造成很大的计算开销和通信开销。
发明内容
本发明为克服现有技术的不足之处,提供一种基于数据打包的隐私保护决策树的样本分类方法,以期能解决当前样本分类过程中的隐私保护问题,在用户非交互的环境下提高样本分类的安全性,同时利用数据打包技术有效地减少用户和服务器之间的计算开销和通信开销。
本发明为解决技术问题采用如下方案:
本发明一种基于数据打包的隐私保护决策树的样本分类方法的特点是应用于由n个参与方{P1,P2,...,Pi,...,Pn},一个主服务器C,一个从服务器S以及BCP系统组成的网络环境中;其中,Pi表示第i个参与方;所述第i个参与方Pi的本地样本集记为Ti,则n个参与方的本地样本集记为T,1≤i≤n;所述第i个参与方Pi的本地样本集Ti拥有s个属性,记为{Ai,1,Ai,2,...,Ai,j,...,Ai,s},其中,Ai,j表示本地样本集Ti的第j个属性;1≤j≤s;所述第j个属性Ai,j拥有t个可能的取值{ai,j,1,ai,j,2,...,ai,j,y,...,ai,j,t};其中,ai,j,y表示所述第j个属性Ai,j的第y个取值;1≤y≤t;所述第i个参与方Pi的本地样本集Ti拥有k个类标签,记为{ci,1,ci,2,...,ci,x,...,ci,k},其中,ci,x表示所述本地样本集Ti的第x个类标签;1≤x≤k;所述样本分类方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010817497.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纳米瓷釉着色剂
- 下一篇:一种可以实现原理图电气互连的设计系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置