[发明专利]面向云存储的多关键词密文检索方法和系统在审
申请号: | 201710155591.3 | 申请日: | 2017-03-16 |
公开(公告)号: | CN108628867A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 苏帅 | 申请(专利权)人: | 北京科瑞云安信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 密文检索 云存储服务器 客户端 云服务器 云存储 加密 信息安全领域 服务器集群 保存数据 加密密钥 密文数据 密文索引 密钥管理 上传 下载 更新 安全 | ||
1.一种面向云存储的多关键词密文检索方法,客户端同时与加密与密文检索云服务器和云存储服务器连接,所述客户端产生的用户数据在客户端实施加密并建立密文索引,其中加密后的数据向云存储服务器上传、下载或更新;数据加解密操作所需的密钥、密文索引及其它加密所需元数据向加密与密文检索云服务器上传、下载或更新,其步骤包括:
1)在所述客户端接收用户输入的查询语句,根据所述查询语句进行词法分析并生成明文关键词;
2)使用用户所属组织的主密钥作为加密密钥,并使用该加密密钥及其对应的加密算法对所述明文关键词进行加密并生成密文关键词;
3)对所述查询语句进行语法分析生成查询树同时将所述密文关键词发给所述加密与密文检索云服务器,根据所述查询树对密文索引进行多关键词密文检索,将检索到的数据元信息和相关度分数进行查询结果排序;
4)根据数据的相关度分数,将排序后的结果传给客户端将查询结果显示给用户,完成检索。
2.如权利要求1所述的面向云存储的多关键词密文检索方法,其特征在于,对数据执行密文上传的具体步骤如下:
1)将不同类型的文件转化为统一格式的文本数据,并对所述文本数据进行词条化分析,得到关键词及该些关键词在数据中的位置信息;
2)使用用户所属组织的加密密钥对得到的明文关键词进行加密,根据密文关键词及其位置信息生成密文索引,所述密文索引包括关键词标识和文件索引链表两部分;
3)随机生成数据加解密密钥,然后使用此密钥对该数据加密;
4)上传数据加解密密钥、密文索引、加密数据标识符到加密与密文检索云服务器,在加密与密文检索云服务器上按照用户的组织,合并其密文索引,同时清理密文索引缓存;
5)将加密后的数据上传至云存储服务器。
3.如权利要求2所述的面向云存储的多关键词密文检索方法,其特征在于,所述索引合并过程按照如下流程进行操作:
按照字典序遍历密文索引的关键词;
对于密文索引均包含的密文关键词,分别遍历密文索引中该关键词对应的文件索引链表,按照文档ID的顺序将文档索引项加入到新的文档索引链表中,遍历完毕之后将生成的新文档索引链表加入到新密文索引中,同时将两者的文档频率相加存放在新的关键词标识中。
4.如权利要求1所述的面向云存储的多关键词密文检索方法,其特征在于,所述查询树的叶子节点存放加密生成的密文关键词,根据所述查询树对密文索引进行多关键词密文检索的方法如下:
1)通过查询树得到要检索的密文关键词集合,遍历密文索引的关键词标识,找到每一个关键词标识对应的文件索引链表;
2)遍历所述文件索引链表,对于每一个文件索引项,计算密文关键词在该文件中的权重系数并将其存放在权重数据表中;
3)从查询树的叶子节点向上回溯,判断遇到的内部节点对应的逻辑关系,若是逻辑与,则对不同关键词所对应的文件索引链表求交集,若是逻辑或,则关键词所对应的文件索引链表求并集,若是逻辑非,则对关键词所对应的文件索引链表求补集;按照如上流程沿着查询树不断回溯,直到树根停止,最后得到所有满足查询条件的文件集合;
4)对结果集合中的每个文件,从权重二维表中取出该文件对应的列向量,对列向量中的所有权重取其期望值并计算方差;其中,期望作为该文件与查询语句的相关度分数,方差作为当期望值相同时排序评判的标准;
5)根据每个文件与查询的相关度分数进行排序,按照排序后的顺序,返回符合查询条件的文件元信息以及其对应的相关度分数。
5.如权利要求4所述的面向云存储的多关键词密文检索方法,其特征在于,所述权重数据表是一个二维表,它的行对应密文关键字,列对应文件;其中权重系数的计算方法为:
1)遍历该关键词对应的文件索引链表,对于链表中的每一个文件索引项,得到其中的关键词频率信息;
2)访问用户文件计数器并得到用户文件总个数,并对关键词标识中的文档频率和用户总文件个数做除法运算,得到的商再取对数;
3)将前两步得到的处理结果相乘,得到关键词在文件中的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科瑞云安信息技术有限公司,未经北京科瑞云安信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710155591.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据融合的方法和装置
- 下一篇:文本分类方法和装置