[发明专利]云环境加密外包数据语义扩展搜索方法及系统在审
申请号: | 201810345112.9 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108549701A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 俞云萍;韩德志;王军;毕坤 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/60;G06F21/62;H04L29/06;H04L29/08 |
代理公司: | 上海信好专利代理事务所(普通合伙) 31249 | 代理人: | 潘朱慧 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 公有云 集合 索引标识符 授权用户 私有云 安全索引 标记向量 文档标记 语义扩展 包数据 云环境 密文 文档 陷门 加密 搜索 用户查询需求 相似度分数 满足条件 搜索请求 文档集合 向量集合 用户隐私 查询 密钥 向量 排序 匹配 发送 返回 | ||
本发明公开了一种云环境加密外包数据语义扩展搜索方法,包含:数据拥有者发送密文文档集合和安全索引集合给公有云服务器,将文档标记向量集合发送给私有云服务器,将密钥发送给授权用户;授权用户将查询标记向量发送给私有云服务器,将陷门发送给公有云服务器完成搜索请求;私有云服务器将文档标记向量和查询标记向量进行匹配,得到满足用户查询需求的候选索引标识符集合,并将候选索引标识符集合发送给公有云服务器;公有云服务器通过收到的候选索引标识符集合和陷门找到对应的安全索引集合,并计算文档的相似度分数并排序,返回满足条件的密文文档给授权用户。其优点是:保护了用户隐私的同时,降低了用户的开销。
技术领域
本发明涉及云计算安全技术领域,具体涉及一种云环境加密外包数据语义扩展搜索方法及系统。
背景技术
目前,伴随着云计算技术的飞速发展,云计算已经成为了一个新的产业结构。越来越多的人选择将一些敏感数据外包给云,开始享受其灵活性和高质量的数据存储服务,而且将数据上传到云端,会减少用户的数据存储和维护带来的开销。但是,云环境下的数据安全问题引起大量关注,为保护数据安全,将数据加密再上传到云端是一种常见方法。数据加密使得数据不再具有原有属性,这使得传统的检索机制失效。随着数据量的增加,如何高效地在大量密文中搜索到所需要的文档已经成为重要的挑战。
可搜索加密技术主要解决在云服务器不完全可信的情况下,支持用户在密文上进行搜索。现有的基于关键词的搜索技术只能返回包含确切查询关键字的文件,并且无法找到包含相关关键词的文件。虽然一些机制如语义或者扩展搜索已经被设计来解决这个问题,但是它们一般都会在客户端进行额外的计算,会带来额外的开销。如果用户查询与索引术语相关的术语语义,则有可能只有少数匹配的结果或者没有结果被返回。因此,用户必须执行更多的查询操作才能获得所需的文件。为了解决这个问题,可以在提交搜索请求之前按照一定的规则扩展查询词,但随着查询关键词的增加,查询扩展会变得越来越复杂,导致更高的计算开销。
现有的多关键词排序搜索通常没有考虑关键词位置信息。关键词出现在标题和正文并没有区分,把所有文档是做一个域,创建的索引不能准确反映关键词在文章中的权重,导致搜索结果不准确。我们使用了域加权评分,将其引入到文档评分当中,对标题,摘要等不同域中的关键词赋予不同的权重加以区分。其次,对筛选出来的中心关键词进行语义扩展,计算语义相似度,将语义相似度、域加权评分和相关度分数三者结合,构造出更加准确的文档索引。目前的多关键词的排序方案大多采用经典的MRSE(multi-keyword rankedsearch over encrypted cloud data)算法,MRSE方案中创建的文档向量的维度通常很大,所以构建得索引所需的时间花费主要都在文档向量和矩阵相乘上。
发明内容
本发明的目的在于提供一种云环境加密外包数据语义扩展搜索方法及系统,通过基于中心关键字的云环境加密外包数据语义扩展搜索,实现了关键字的语义扩展搜索,保护了用户隐私的同时,降低了用户的开销。
为了达到上述目的,本发明通过以下技术方案实现:
一种云环境加密外包数据语义扩展搜索方法,其特征是,包含以下步骤:
S1、数据拥有者从明文文档集合中抽取关键词,得到关键词集合,且生成密钥SK,根据关键词集合和密钥SK构建出安全索引集合和文档标记向量集合;
S2、数据拥有者将明文文档集合中的每篇文档分别加密成密文文档,生成密文文档的公钥和私钥sk,并将得到的密文文档集合和安全索引集合上传到公有云服务器,将文档标记向量集合发送到私有云服务器;
S3、授权用户输入查询需求时,利用斯坦福解析器来判断分析语法关系和语法结构,得到初始查询关键词并计算其权重;
S4、根据权重大小对初始查询关键词进行排序得到初始查询关键词集,对初始查询关键词集进行语义扩展,得到中心语义扩展集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810345112.9/2.html,转载请声明来源钻瓜专利网。