[发明专利]一种云存储环境下中文语音密文存储、检索方法及系统在审

专利信息
申请号: 202011138829.X 申请日: 2020-10-22
公开(公告)号: CN112233666A 公开(公告)日: 2021-01-15
发明(设计)人: 陈驰;韦馨蕾;田雪;王佳宁;苏帅 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G10L15/06 分类号: G10L15/06;G10L15/14;G10L15/183;G10L15/22;G10L15/26;H04L9/06;H04L29/06;H04L29/08;G06F16/683
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 余长江
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 存储 环境 中文 语音 文存 检索 方法 系统
【说明书】:

本发明提供一种云存储环境下中文语音密文存储、检索方法及系统,包括:用户端,用以生成语音文件;生成查询关键字;解密密文数据,得到音频文件;服务端,用以接收并识别语音文件,生成识别文本文件;获取识别文本文件的关键字,并对语音文件与关键字加密,将生成的密文数据及密文索引上传至云服务器端;接收查询关键字并加密;根据加密结果,生成查询请求并发送至云服务端;接收云服务端发送的密文数据并返回至客户端;云服务端,用以存储语音文件的密文数据及密文索引;通过密文查询请求及密文索引,获取密文数据。本发明可以通过文本关键字对语音的内容进行检索,能够对语音文件进行密文检索。

技术领域

本发明涉及信息安全领域,具体地说,涉及一种云存储环境下中文语音密文存储、检索方法及系统。

背景技术

云计算技术以及大数据存储技术的发展优化了传统的数据存储,通过虚拟化和分布式计算与存储技术,云存储将多个存储介质整合为统一的存储资源池,向用户提供存储服务,用户不再需要自行购买硬件,只需要简单地操作就能将数据存储到云端。由于云存储的便捷与经济,许多企业与个人将数据上传到云端交由第三方云服务商保存。然而,在云计算环境下,数据管理权从数据所有者转移到了第三方云服务商,云存储在给企业与个人的数据管理带来便利的同时,也带来了极大的安全隐患。根据云安全联盟(CSA)在2016年公布的云计算面临的十二大安全威胁中,数据泄露排在了第一位。数据泄露会带来隐私泄露的问题,极大地威胁了云存储中企业以及个人数据的机密性。为了保证云存储中数据的机密性,可以采取密文存储的方式,先对文件进行加密,再将密文文件存储到云端。然而,云计算中存在着海量的数据,如何快速查找到这些密文数据成为了一个难题。为了解决这一问题,出现了密文检索技术,然而大部分的密文检索技术仅仅针对文本文件进行检索。在云存储中,除了文本类型的文件,还存在着大量的其他类型的文件,语音类型的文件(如会议录音、通话记录等)也是云存储中常见的文件类型。因此,如何对语音内容进行快速、准确以及高效的密文检索成为了迫切需要解决的问题。

已公开的专利申请CN201910500492.3提供了一种语音检索方法及系统。该方法借鉴生物哈希技术,对原始语音进行特征提取,获取原始语音的第一哈希序列,将第一哈希序列作为检索摘要,通过比较第一哈希序列和查询语音的第二哈希序列的汉明距离,完成检索内容的匹配。该方法通过采用生物哈希技术提取语音的哈希摘要,提高了语音哈希摘要的安全性,但是该方法只能通过语音检索到相似的语音文件,不能通过文本关键字对语音内包含的信息进行检索。

已公开的专利申请CN201910019614.7基于音频浓缩摘要的海量音频检索方法,提供了一种基于音频浓缩摘要的海量音频检索方法。包括如下步骤:选择文件夹,生成多线程执行浓缩任务,打开待浓缩的文件,读取音频帧并解码,得到裸的PCM数据,使用VAD算法对PCM裸数据进行判定,并进行语音识别生成摘要信息和音频索引文件,提供音频的检索和播放功能。通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩,提取出有价值的语音和文字信息,并生成包含摘要信息的音频索引文件,用户可输入文本关键字进行快速检索,大大提高了工作效率。然而,该方法对语音文件的摘要和检索主要在明文状态下进行,在云存储环境下难以保证安全性。

发明内容

针对现有技术中存在的技术问题,本发明的目的在于提供一种云存储环境下中文语音密文存储、检索方法及系统,主要思想是通过中文语音识别生成语音内容的文字信息,并生成包含语音内容的密文索引,最终通过密文检索接口,利用文本关键词实现对加密的语音文件内容进行检索,其为企业和用户提供语音文件的安全加密存储,并且在语音数据不解密的情况下,对用户提供利用文本关键字检索语音内容的功能,保证云存储环境下语音文件的机密性,保护用户的隐私不被侵犯,并提高检索效率。

本发明的技术方案如下:

一种云存储环境下中文语音密文存储方法,适用于云服务端、服务端及用户端组成的网络系统,其步骤包括:

1)接收并识别用户端发送的语音文件,生成识别文本文件;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011138829.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top