[发明专利]一种相似性感知的安全数据去重加密方法有效
申请号: | 201710963426.0 | 申请日: | 2017-10-09 |
公开(公告)号: | CN107659401B | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 冯丹;周玉坤;华宇;夏文;黄方亭;张宇成 | 申请(专利权)人: | 华中科技大学 |
主分类号: | H04L9/08 | 分类号: | H04L9/08;H04L9/00;H04L9/06 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似性 感知 安全 数据 加密 方法 | ||
技术领域
本发明属于计算机存储和安全领域,更具体地,涉及一种相似性感知的安全数据去重加密方法。
背景技术
数据量的不断增加对数据存储管理的可扩展性提出了严重的挑战。IDC机构预测到2020年,所有的电子数据量将会达到44ZB。而云计算的发展为数据的存储和计算提供按需资源配置和最优的服务分配,这解决了数据量增加的扩展性挑战。CISCO公司的数据表示全球86%的数据中心的工作量将在云中处理。据微软的研究结果证明在文件系统中存在超过50%,以及在备份应用程序中有最多90%-95%的冗余数据。而数据去重是一种系统级的压缩技术,通过对重复数据值保留一个物理副本的方式来节约存储空间和计算资源。数据去重可以实现在文件级和块级,因此许多云存储系统,例如Dropbox,Wuala和Bitcasa采用数据去重来节省存储成本。
尽管数据去重降低了系统维护成本,但是在云系统中也出现了很多的安全问题。例如,在特定云中的应用数据容易遭受到操作失误和软件程序的错误。云服务提供商是不能被完全信任的,内部的攻击者可能会窃取用户的敏感数据。源端数据去重还遭受到侧信道攻击(Side-channel attacks),即敌手可以通过观察文件是否去重来猜测文件的内容。为了保护用户数据的机密性,用户会使用传统的对称加密算法(例如,高级加密标准AES(Advanced Encryption Standard))产生安全的随机密钥来加密自己的数据,将密文传输到云服务提供商。由于不同用户会产生不同的密钥,因此即使相同的数据也会生成不同的密文导致无法进行数据去重和压缩。此外,如果不同用户之间共享密钥,则会导致密钥管理开销增加。为了解决数据去重与加密之间的矛盾,消息锁加密(Message-locked Encryption(MLE))。具体而言,消息锁加密MLE是一种确定性的对称加密算法,加密密钥来自于数据的哈希,加密函数采用AES算法,而数据的指纹来至于对密文的哈希值。因此相同的数据可以产生相同的指纹,在指纹索引查询中,重复数据可以被消除掉。
然而,MLE加密方法容易遭受到暴力破解攻击(Brute-force attacks),敌手可以产生大量的文件,通过遍历的方式猜测低熵文件的内容,主要原因是密钥和加密函数的确定化。为抵抗暴力破解攻击,Bellare等人提出基于服务器协助的消息锁加密,以用户数据的哈希作为输入,采用基于RSA或者BLS盲签名的不经意伪随机协议(oblivious pseudorandom protocol(OPRF)),产生数据密钥。其加密和指纹生成过程是与消息锁加密机制是相同的。但是,基于RSA和BLS盲签名的OPRF协议计算开销大,因为该协议需要多次的模指数运算。特别是对于细粒度数据去重中的小文件和数据块,计算开销会随着文件数目和数据块数目线性增长。例如,假定平均块长为8KB,那么512TB的数据集将会产生236个数据块;因此,对于大量数据块的不经意伪随机协议计算,会产生大量的计算和密钥生成时间开销。
为了解决暴力破解攻击和减少计算开销:第一,SecDep结合了跨用户的文件级去重和用户内的块级去重,在文件级采用安全但开销较大的基于服务器协助的收敛加密,而在块级采用低开销的基于用户协助的收敛加密,因此SecDep能够减少密钥生成开销。。据统计,在真实系统,特别是文件系统和备份系统数据集中小文件数目占据了80%的文件数量。但是SecDep对于数量特别多的小文件计算时间开销较大。第二,将小文件和数据块聚合成一个较大单元的数据段(segment),每个数据段提取最小哈希(e.g.,min-hash)。以最小哈希作为输入,生成随机信息和数据块的密钥来减少密钥的生成开销。然而,该方法容易遭受到新的安全攻击并增加存储开销。具体而言,敌手可以产生大量的相似文件,将相似文件聚合并分割成数据段,提取最小哈希产生每个数据块的密钥及指纹。利用侧信道攻击的方法,通过观察哪些数据块重复获取正确的明文。然后只需要对非重复的数据块进行暴力破解攻击,极大地减少了攻击的开销,使得用户数据隐私泄露。此外,如果最小哈希发生变化,则原本重复的数据块会产生不同密钥和密文,导致数据去重率下降,增加存储开销。因此当前的解决方案,在安全性,系统性能方面存在一些缺陷和不足。
由此可见,现有技术存在数据安全隐患,对于小文件和数据块密钥生成和加密速度较慢,同时数据去重压缩率下降,增加存储开销的技术问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963426.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置