[发明专利]一种云网络中面向加密云数据多关键词匹配排序搜索方法在审

申请号：	201810306668.7	申请日：	2018-04-08
公开（公告）号：	CN108563732A	公开（公告）日：	2018-09-21
发明（设计）人：	刘良桂;孙辉;贾会玲;张宇	申请（专利权）人：	浙江理工大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	邱启旺
地址：	310018 浙江省杭***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种云网络中面向加密云数据多关键词匹配排序搜索方法，该方法采用多关键词的形式建立索引，使得从一篇文档中提取的多个关键词通过综合评分算法映射到索引的一个维度上，同时在搜索过程中采用匹配得分算法，这种算法结合综合评分算法使得搜索结果能够根据匹配类型和匹配关键词的多少来进行排序，因此本发明的方法减少了索引存储开销，排序精度高，且加密和搜索效率高。
搜索关键词：	排序关键词匹配评分算法云网络搜索匹配关键词建立索引匹配类型搜索过程搜索结果搜索效率算法结合索引存储映射算法维度文档索引加密匹配
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种云网络中面向加密云数据多关键词匹配排序搜索方法，其特征在于，该方法包括如下步骤：S1：设从第i篇文档中提取的关键词组成的集合为gi，所有文档的关键词集组成的集合记为G，由G中所有不重复的元素组成的集合记为词典集D，记dj为词典集D中第j个关键词词典，计算gi∩dj中第b个关键词vi,b的归一化词频TF(vi,b)：其中，wi,k表示第i篇文档中提取的第k个关键词，fi,k和fi,b分别表示关键词wi,k和vi,b在第i篇文档中出现的次数。S2：根据数据所有者提供的词典集D中关键词词典的个数n，创建一个n维的索引向量索引向量的第j(j＝1,2,...,n)维是一个关键词词典d_j(j＝1,2,...,n)中的所有关键词在第i篇文档F_i中的综合评分CS，所述的综合评分CS的计算过程如下：(a)设定综合评分CS的初始值CS＝0；给定参数α和qα，记{αb}是首项为α公比为qα的等比数列；(b)给定gi和dj，并记gi∩dj中有y个元素；(c)当gi＝dj时，CS＝IMAX_SCORE，转(f)；否则b＝0转(d)；其中，IMAX_SCORE为最高综合评分；(d)当b＝y时，转(f)；否则b＝b+1,转(e)；(e)如果b＝1，CS1＝TF(vi,b)，α1＝α,转(d)；如果b>1，则CSb＝CSb‑1+(TF(vi,b)+αb‑1)，并使αb＝αb‑1qα,转(d)；(f)输出CS；S3：将n维的索引向量扩展到n+u维，并将其设置成服从同一均匀分布U(μ‑c,μ+c)的随机数ε；然后再扩展至n+u+1维，形成并将最后一维设置成常数1；S4：生成索引和查询请求的两个加密密钥M1和M2，以及对索引和查询请求进行随机分割的分割指示器S，其中，M1和M2是(n+u+1)×(n+u+1)维随机可逆矩阵，S∈{0,1}n+u+1，n是词典集中关键词词典的总数，u+1是扩展的维度；S5：根据分割指示器S的值对扩展后的索引随机分割成和分割规则如下，当S[j]等于0时，和设置成任意两个不相等的随机数，且它们的和等于当S[j]等于1时，和设置成两个相等的数且都等于S6：用密钥M₁和M₂对分割后的索引和进行加密，最终生成加密索引S7：设查询时输入的关键词构成的集合记为e，词典集D中第j个关键词词典仍记为dj，则计算dj∩e中第b个关键词vj,b的归一化反词频其中，n表示词典总数，Ik和Ib分别表示词典集D中包含关键词wj,k和vj,b的词典数。S8：根据授权用户输入的查询关键词创建一个n维的查询请求的第j(j＝1,2,...,n)维是查询关键词集e与对应的关键词词典d_j(j＝1,2,...,n)的匹配得分MS，MS具体计算过程如下：(a)设定匹配得分MS的初始值MS＝0；给定参数β和qβ，记{βb}是首项为β公比为qβ的等比数列；(b)给定e和dj，并记dj∩e中有y个元素；(c)当e＝dj时，MS＝QMAX_SCORE，转(f)；否则b＝0转(d)；其中，MS＝QMAX_SCORE为最高匹配得分；(d)当b＝y时，转(f)；否则b＝b+1,转(e)；(e)如果b＝1，MS1＝TF(vj,b)，β1＝β,转(d)；如果b>1，则MSb＝MSb‑1+(IDF(vj,b)+βb‑1)，并使βb＝βb‑1qβ,转(d)；(f)输出MS；S9：对查询请求从n维扩展到n+u维，并从中随机选出z个位置设置成1，其余位置设置成0；然后乘以随机数r；最后将扩展至n+u+1维，并将其设置成另一随机数t；S10：根据分割指示器S的值对扩展后的查询请求随机分割成和分割规则如下：如果S[j]等于1，和设置成任意两个不相等的随机数，且它们的和等于如果S[j]等于0，和设置成两个相等的数，且都等于S11：对分割后的查询请求和加密生成陷门T，S12：将授权用户输入的查询关键词生成陷门后提交给云服务器进行搜索，即计算查询陷门与每个索引向量的安全内积，然后根据内积数值的大小对搜索结果进行排序，并将得分较高的前k个结果返回给授权用户，云服务器执行搜索过程如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江理工大学，未经浙江理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810306668.7/，转载请声明来源钻瓜专利网。

上一篇：一种情感分类方法及装置
下一篇：一种基于贝叶斯推理的土地利用数据同化方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种云网络中面向加密云数据多关键词匹配排序搜索方法在审

专利文献下载