[发明专利]一种云网络中面向加密云数据多关键词匹配排序搜索方法在审
申请号: | 201810306668.7 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108563732A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 刘良桂;孙辉;贾会玲;张宇 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种云网络中面向加密云数据多关键词匹配排序搜索方法,该方法采用多关键词的形式建立索引,使得从一篇文档中提取的多个关键词通过综合评分算法映射到索引的一个维度上,同时在搜索过程中采用匹配得分算法,这种算法结合综合评分算法使得搜索结果能够根据匹配类型和匹配关键词的多少来进行排序,因此本发明的方法减少了索引存储开销,排序精度高,且加密和搜索效率高。 | ||
搜索关键词: | 排序 关键词匹配 评分算法 云网络 搜索 匹配关键词 建立索引 匹配类型 搜索过程 搜索结果 搜索效率 算法结合 索引存储 映射 算法 维度 文档 索引 加密 匹配 | ||
【主权项】:
1.一种云网络中面向加密云数据多关键词匹配排序搜索方法,其特征在于,该方法包括如下步骤:S1:设从第i篇文档中提取的关键词组成的集合为gi,所有文档的关键词集组成的集合记为G,由G中所有不重复的元素组成的集合记为词典集D,记dj为词典集D中第j个关键词词典,计算gi∩dj中第b个关键词vi,b的归一化词频TF(vi,b):其中,wi,k表示第i篇文档中提取的第k个关键词,fi,k和fi,b分别表示关键词wi,k和vi,b在第i篇文档中出现的次数。S2:根据数据所有者提供的词典集D中关键词词典的个数n,创建一个n维的索引向量索引向量的第j(j=1,2,...,n)维是一个关键词词典dj(j=1,2,...,n)中的所有关键词在第i篇文档Fi中的综合评分CS,所述的综合评分CS的计算过程如下:(a)设定综合评分CS的初始值CS=0;给定参数α和qα,记{αb}是首项为α公比为qα的等比数列;(b)给定gi和dj,并记gi∩dj中有y个元素;(c)当gi=dj时,CS=IMAX_SCORE,转(f);否则b=0转(d);其中,IMAX_SCORE为最高综合评分;(d)当b=y时,转(f);否则b=b+1,转(e);(e)如果b=1,CS1=TF(vi,b),α1=α,转(d);如果b>1,则CSb=CSb‑1+(TF(vi,b)+αb‑1),并使αb=αb‑1qα,转(d);(f)输出CS;S3:将n维的索引向量扩展到n+u维,并将其设置成服从同一均匀分布U(μ‑c,μ+c)的随机数ε;然后再扩展至n+u+1维,形成并将最后一维设置成常数1;S4:生成索引和查询请求的两个加密密钥M1和M2,以及对索引和查询请求进行随机分割的分割指示器S,其中,M1和M2是(n+u+1)×(n+u+1)维随机可逆矩阵,S∈{0,1}n+u+1,n是词典集中关键词词典的总数,u+1是扩展的维度;S5:根据分割指示器S的值对扩展后的索引随机分割成和分割规则如下,当S[j]等于0时,和设置成任意两个不相等的随机数,且它们的和等于当S[j]等于1时,和设置成两个相等的数且都等于S6:用密钥M1和M2对分割后的索引和进行加密,最终生成加密索引S7:设查询时输入的关键词构成的集合记为e,词典集D中第j个关键词词典仍记为dj,则计算dj∩e中第b个关键词vj,b的归一化反词频其中,n表示词典总数,Ik和Ib分别表示词典集D中包含关键词wj,k和vj,b的词典数。S8:根据授权用户输入的查询关键词创建一个n维的查询请求的第j(j=1,2,...,n)维是查询关键词集e与对应的关键词词典dj(j=1,2,...,n)的匹配得分MS,MS具体计算过程如下:(a)设定匹配得分MS的初始值MS=0;给定参数β和qβ,记{βb}是首项为β公比为qβ的等比数列;(b)给定e和dj,并记dj∩e中有y个元素;(c)当e=dj时,MS=QMAX_SCORE,转(f);否则b=0转(d);其中,MS=QMAX_SCORE为最高匹配得分;(d)当b=y时,转(f);否则b=b+1,转(e);(e)如果b=1,MS1=TF(vj,b),β1=β,转(d);如果b>1,则MSb=MSb‑1+(IDF(vj,b)+βb‑1),并使βb=βb‑1qβ,转(d);(f)输出MS;S9:对查询请求从n维扩展到n+u维,并从中随机选出z个位置设置成1,其余位置设置成0;然后乘以随机数r;最后将扩展至n+u+1维,并将其设置成另一随机数t;S10:根据分割指示器S的值对扩展后的查询请求随机分割成和分割规则如下:如果S[j]等于1,和设置成任意两个不相等的随机数,且它们的和等于如果S[j]等于0,和设置成两个相等的数,且都等于S11:对分割后的查询请求和加密生成陷门T,S12:将授权用户输入的查询关键词生成陷门后提交给云服务器进行搜索,即计算查询陷门与每个索引向量的安全内积,然后根据内积数值的大小对搜索结果进行排序,并将得分较高的前k个结果返回给授权用户,云服务器执行搜索过程如下:
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810306668.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种情感分类方法及装置
- 下一篇:一种基于贝叶斯推理的土地利用数据同化方法