[发明专利]一种支持动态更新的多关键字密文检索方法在审
申请号: | 201910608519.0 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110569327A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 秦志光;曾星伟;秦臻;丁熠;马蓉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 51242 成都环泰知识产权代理事务所(特殊普通合伙) | 代理人: | 赵红欣;李斌 |
地址: | 611730 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 原始文档 索引 倒排索引 动态更新 降维处理 密文检索 主题分布 构建 加密 平衡二叉树 磁盘空间 授权用户 选取模块 云服务器 主题索引 索引树 检索 占用 更新 平衡 | ||
1.一种支持动态更新的多关键字密文检索方法,其特征在于:步骤如下:
S1,数据拥有者通过主题选取模块从原始文档中提取出原始文档中的主题数量;
S2,将主题数量和原始文档一起作为输入,使用LDA对原始文档进行降维处理,得到文档-主题分布和主题-关键词分布;
S3,利用主题-关键词分布构建一棵主题索引树,此树为一棵平衡二叉树;
S4,利用文档-主题分布构建关于主题的倒排索引;
S5,将主题平衡二叉索引树和倒排索引进行加密,将其与加密的文档一起上传到云服务器;
S6,利用步骤S4、S5中的索引进行检索;
S7,授权用户对文档和索引进行更新。
2.根据权利要求1所述支持动态更新的多关键字密文检索方法,其特征在于:所述步骤S1中主题数量利用K-L散度算法得到。
3.根据权利要求1所述的支持动态更新的多关键字密文检索方法,其特征在于:所述步骤S2中从文档-主题分布中抽取出每个文档得分最高的主题,得到文档-主题集合,从而使得每个文档在整个倒排索引中只出现一次。
4.根据权利要求1所述的支持动态更新的多关键字密文检索方法,其特征在于:所述平衡二叉树的构建方法为:
a、每一个叶子节点对应一个主题i,存储的向量为Ui,即第i个主题对应的所有关键字的得分向量;
b、两个叶子节点组成一棵树,其父节点是整棵二叉树的一棵子树,节点中的向量为左右孩子节点的相关度得分;
c、节点中存储的向量采用安全K近邻算法加密。
其中:主题-词分布为一个t×m矩阵U,t代表主题数量,m代表所有文档包含的总关键词数量,矩阵中的值Uij(0≤i≤j,0≤j≤m)为第j个关键词和第i个主题的相关度得分,文档-主题分布为一个n×t矩阵V,n代表所有的文档数量,t代表主题数量,矩阵中的值Vki(0≤k≤n)代表第k个文档对应第i个主题的相关度得分。
5.根据权利要求1所述的支持动态更新的多关键字密文检索方法,其特征在于:所述倒排索引构建方法为;
a、从文档-主题分布中选出每一个文档中相关度得分最大的主题,据此构建倒排索引;
b、索引为主题,索引值为属于该主题的文档集合及其相关性得分。
6.根据权利要求1所述的支持动态更新的多关键字密文检索方法,其特征在于:所述步骤S6中的检索步骤为:
a、授权用户可向数据拥有者发送要检索的关键词集合,数据拥有者根据关键词集合计算得到一个搜索陷门;
b、授权用户根据步骤a提供的搜索陷门向云服务器发出搜索请求;
c、主题二叉平衡树上计算节点向量和查询向量的相关度,相关度得分高的节点作为下一次查询的节点入口,如此循环直到叶节点为止;
d、根据叶节点得到的主题找到该主题对应的反向索引,对反向索引列表中的元素进行排序,得到相关度得分最高的文档指针,云服务器将该文档返回给授权用户。
7.根据权利要求1所述的支持动态更新的多关键字密文检索方法,其特征在于:所述步骤S7中文档的更新包括新增和删除;
新增时,通过LDA模型推断出该文档的主题,该主题不存在,则在主题平衡二叉树中加入新的主题叶子节点,并新建一个该主题的反向索引,该主题存在,直接找到该主题对应的反向索引,向其中插入该文档;
删除时,根据文档编号遍历每个反向索引找到对应的文档从中删除即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910608519.0/1.html,转载请声明来源钻瓜专利网。