[发明专利]大数据安全之全密态检索研究在审
申请号: | 202010841426.5 | 申请日: | 2020-08-20 |
公开(公告)号: | CN112702379A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 李彦江;孙晓梅;于东生;周龙;王金波 | 申请(专利权)人: | 纬领(青岛)网络安全研究院有限公司;中国电子科技集团公司第三十研究所 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L29/06;G06F21/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 26603*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 安全 全密态 检索 研究 | ||
1.大数据安全之全密态检索系统分为客户端和服务端,两者通过信道加密交互,进行文件加密及检索服务(包括文档检索、图片检索);服务端存储文件的密文索引,检索在服务器进行,数据存储服务器仅存储加密文件。这样就杜绝了数据服务器对用户的隐私扫描和检测。数据存储服务器支持私有云OpenStack和FTP服务器。
2.根据权利要求1所述的客户端技术实现,是通过与服务端和云盘交互,可以实现用户登陆、文件加密上传和下载以及文档、图片的检索等功能。文档检索通过输入关键词来进行搜索,图片检索需要选择图片来进行搜索。服务端主要有用户管理、密文检索、图片检索、文件管理、分享、权限分级、在线人数统计、流量统计、信道加密传输、多线程响应用户请求、服务端激活授权策略等功能。
3.根据权利要求2所述的客户端对文件进行加密及检索服务中文档内容提取,主要针对以下三种文档:pdf、office文档(word、excel、ppt)和txt;内容的提取包括文本提取和图片提取,主要是通过调用python脚本来实现的。
4.根据权利要求1和2所述的客户端对文本内容进行分词,并建立密文索引。是利用“结巴分词”;“结巴”中文分词:做最好的 Python 中文分词组件,它是国内完全开源的一套分词系统;jieba支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
5.根据权利要求4所述的系统结巴分词采取的是搜索引擎模式;Jieba有各种语言版本,java,python,C++,C,本系统采用的是C版本;基本字典jieba.dict.utf8可以根据需求更改;可以在用户字典user.dict.utf8中添加自定义词。
6.根据权利要求1和2所述的客户端对上传的图片文件及文档中的图片建索引。是通过感知哈希算法。感知哈希算法对每一张图片生成一个64比特“指纹”,通过比较两张图片的指纹,来判断他们的相似度,是否属于同一张图片、或相似图片。Qt支持的图片格式有supportedImageList: (bmp, cur, dds, gif, icns, ico, jpeg, jpg, pbm, pgm, png, ppm, svg, svgz, tga, tif, tiff, wbmp, webp, xbm, xpm),这些图片都可以进行索引、检索。
7.根据权利要求1和2所述的客户端对系统用到的加解密函数及秘钥设置:
(1)文件加解密:采用高强度加密算法,确保保密性;用AES cbc模式进行文件加密,秘钥采用256bit随机数;采用PKCS5进行填充,解密时自动去除。
(2)文件加密秘钥在服务端加密存储,确保秘钥安全;文件加密秘钥通过AES固定秘钥进行加密;固定秘钥不是明文存放的,而是通过rand()函数和变换得来;前后部分存在不同数组里,保证秘钥不是存在连续的内存里。
(3)关键字加密和用户口令加密:使用不可恢复的单向哈希计算,保护用户隐私;利用HMAC_sha256进行关键字和用户口令加密,其秘钥均为64字节随机数;
(4)信道加密:使用RC4信道加密,保证传输安全;利用RC4进行信道加密,秘钥为256字节随机数;
(5)文件hash:利用MD5对文件进行hash;
(6)以上所述的所有的加解密,均调用Openssl库里的函数来实现。
8.根据权利要求1和2所述的服务端文档全密态检索采用MongoDB、倒排表方式实现密关键词的存储和快速检索,优点在于检索速度快,便于插入和删除;共享文件和权限文件的判断;多关键词检索结果输出判断标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纬领(青岛)网络安全研究院有限公司;中国电子科技集团公司第三十研究所,未经纬领(青岛)网络安全研究院有限公司;中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010841426.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置