[发明专利]云环境加密外包数据语义扩展搜索方法及系统在审
申请号: | 201810345112.9 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108549701A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 俞云萍;韩德志;王军;毕坤 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/60;G06F21/62;H04L29/06;H04L29/08 |
代理公司: | 上海信好专利代理事务所(普通合伙) 31249 | 代理人: | 潘朱慧 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 公有云 集合 索引标识符 授权用户 私有云 安全索引 标记向量 文档标记 语义扩展 包数据 云环境 密文 文档 陷门 加密 搜索 用户查询需求 相似度分数 满足条件 搜索请求 文档集合 向量集合 用户隐私 查询 密钥 向量 排序 匹配 发送 返回 | ||
1.一种云环境加密外包数据语义扩展搜索方法,其特征在于,包含以下步骤:
S1、数据拥有者从明文文档集合中抽取关键词,得到关键词集合,且生成密钥SK,根据关键词集合和密钥SK构建出安全索引集合和文档标记向量集合;
S2、数据拥有者将明文文档集合中的每篇文档分别加密成密文文档,生成密文文档的公钥和私钥sk,并将得到的密文文档集合和安全索引集合上传到公有云服务器,将文档标记向量集合发送到私有云服务器;
S3、授权用户输入查询需求时,利用斯坦福解析器来判断分析语法关系和语法结构,得到初始查询关键词并计算其权重;
S4、根据权重大小对初始查询关键词进行排序得到初始查询关键词集,对初始查询关键词集进行语义扩展,得到中心语义扩展集;
S5、授权用户使用数据拥有者给的密钥SK,根据中心语义扩展集构造相应的陷门和查询标记向量集合,并将陷门提交给公有云服务器,将查询标记向量集合发送给私有云服务器,以完成搜索请求;
S6、私有云服务器接收到授权用户发送的查询标记向量集合,将查询标记向量和文档标记向量进行匹配,得到满足授权用户查询需求的候选索引标识符集合;
S7、私有云服务器将候选索引标识符集合上传到公有云服务器,公有云服务器根据候选索引标识符集合和陷门找到对应的安全索引集合,根据对应的安全索引集合和陷门计算文档的相似度并排序,返回满足的前k篇密文文档给授权用户;
S8、授权用户使用数据拥有者给的私钥sk对返回的密文文档进行解密,得到明文文档。
2.如权利要求1所述的云环境加密外包数据语义扩展搜索方法,其特征在于,所述的步骤S1具体包含:
S11、数据拥有者从明文文档集合F={f1,f2,…,fn}中抽取关键词,得到关键词集合W={w1,w2,…,wm};
S12、根据关键词集合W={w1,w2,…,wm},数据拥有者随机产生一个(n+2)比特的指示向量S和2h个维度为((n+2)/h)×((n+2)/h)的可逆矩阵{M11,M12,…,M1h,M21,M22,…,M2h},其中M11,M12,…,M1h,M21,M22,…,M2h皆为((n+2)/h)×((n+2)/h)维度的可逆矩阵,h是一个正整数并且满足h|(n+2),生成密钥SK={S,M11,M12,…,M1h,M21,M22,…,M2h,u,h},u是一个正整数且u|n;
S13、基于向量空间模型,数据拥有者为每篇文档fi生成一个文档向量Di,如果文档fi中包含关键词wj,则Di[j]=1,如果文档fi中不包含关键词wj,则Di[j]=0,其中wj来源于数据拥有者上传的文档所抽取的关键词集合W={w1,w2,…,wm},j=(1,2…m);
S14、将文档向量Di均分成u块,如果某个块全为0,则标记值bbs=0,否则bbs=1,其中(s=1,2,…,u),得到bi={bb1,bb2,…,bbu},进而得到文档标记向量ei={bi,sidi}以得到文档标记向量集合E=(e1,e2,…,em);
S15、将Di[j]中1的值设置为(Zij·(wft,f×idft)),其中Zij是域加权评分,wf-idf=wft,f×idft;tft,f是词项频率,表示关键词t在文档中出现的次数,idft是逆文档频率,表示关键词t在文档集合中的罕见程度,定义表示为N表示所有文档的篇数,dft为包含关键词t的文档篇数,然后,对文档向量Di进行维度扩展,第(n+1)位设置为一个随机数ε,第(n+2)位设置成1,则Di表示为(Di,ε,1),根据指示向量S将文档向量Di分裂成D′i和D″i,将D′i和D″i分别分成h段,得到Di'=(Di1',Di2',…,Dih'),Di=(Di1,Di2,…,Dih),之后使用密钥SK={S,M11,M12,…,M1h,M21,M22,…,M2h,u,h}进行加密,得到和对应的安全索引Ii=(sidi,Vi),以得到安全索引集合I=(I1,I2,…,Im)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810345112.9/1.html,转载请声明来源钻瓜专利网。