[发明专利]一种云存储环境下中文语音密文存储、检索方法及系统在审
申请号: | 202011138829.X | 申请日: | 2020-10-22 |
公开(公告)号: | CN112233666A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 陈驰;韦馨蕾;田雪;王佳宁;苏帅 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/183;G10L15/22;G10L15/26;H04L9/06;H04L29/06;H04L29/08;G06F16/683 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余长江 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储 环境 中文 语音 文存 检索 方法 系统 | ||
本发明提供一种云存储环境下中文语音密文存储、检索方法及系统,包括:用户端,用以生成语音文件;生成查询关键字;解密密文数据,得到音频文件;服务端,用以接收并识别语音文件,生成识别文本文件;获取识别文本文件的关键字,并对语音文件与关键字加密,将生成的密文数据及密文索引上传至云服务器端;接收查询关键字并加密;根据加密结果,生成查询请求并发送至云服务端;接收云服务端发送的密文数据并返回至客户端;云服务端,用以存储语音文件的密文数据及密文索引;通过密文查询请求及密文索引,获取密文数据。本发明可以通过文本关键字对语音的内容进行检索,能够对语音文件进行密文检索。
技术领域
本发明涉及信息安全领域,具体地说,涉及一种云存储环境下中文语音密文存储、检索方法及系统。
背景技术
云计算技术以及大数据存储技术的发展优化了传统的数据存储,通过虚拟化和分布式计算与存储技术,云存储将多个存储介质整合为统一的存储资源池,向用户提供存储服务,用户不再需要自行购买硬件,只需要简单地操作就能将数据存储到云端。由于云存储的便捷与经济,许多企业与个人将数据上传到云端交由第三方云服务商保存。然而,在云计算环境下,数据管理权从数据所有者转移到了第三方云服务商,云存储在给企业与个人的数据管理带来便利的同时,也带来了极大的安全隐患。根据云安全联盟(CSA)在2016年公布的云计算面临的十二大安全威胁中,数据泄露排在了第一位。数据泄露会带来隐私泄露的问题,极大地威胁了云存储中企业以及个人数据的机密性。为了保证云存储中数据的机密性,可以采取密文存储的方式,先对文件进行加密,再将密文文件存储到云端。然而,云计算中存在着海量的数据,如何快速查找到这些密文数据成为了一个难题。为了解决这一问题,出现了密文检索技术,然而大部分的密文检索技术仅仅针对文本文件进行检索。在云存储中,除了文本类型的文件,还存在着大量的其他类型的文件,语音类型的文件(如会议录音、通话记录等)也是云存储中常见的文件类型。因此,如何对语音内容进行快速、准确以及高效的密文检索成为了迫切需要解决的问题。
已公开的专利申请CN201910500492.3提供了一种语音检索方法及系统。该方法借鉴生物哈希技术,对原始语音进行特征提取,获取原始语音的第一哈希序列,将第一哈希序列作为检索摘要,通过比较第一哈希序列和查询语音的第二哈希序列的汉明距离,完成检索内容的匹配。该方法通过采用生物哈希技术提取语音的哈希摘要,提高了语音哈希摘要的安全性,但是该方法只能通过语音检索到相似的语音文件,不能通过文本关键字对语音内包含的信息进行检索。
已公开的专利申请CN201910019614.7基于音频浓缩摘要的海量音频检索方法,提供了一种基于音频浓缩摘要的海量音频检索方法。包括如下步骤:选择文件夹,生成多线程执行浓缩任务,打开待浓缩的文件,读取音频帧并解码,得到裸的PCM数据,使用VAD算法对PCM裸数据进行判定,并进行语音识别生成摘要信息和音频索引文件,提供音频的检索和播放功能。通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩,提取出有价值的语音和文字信息,并生成包含摘要信息的音频索引文件,用户可输入文本关键字进行快速检索,大大提高了工作效率。然而,该方法对语音文件的摘要和检索主要在明文状态下进行,在云存储环境下难以保证安全性。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种云存储环境下中文语音密文存储、检索方法及系统,主要思想是通过中文语音识别生成语音内容的文字信息,并生成包含语音内容的密文索引,最终通过密文检索接口,利用文本关键词实现对加密的语音文件内容进行检索,其为企业和用户提供语音文件的安全加密存储,并且在语音数据不解密的情况下,对用户提供利用文本关键字检索语音内容的功能,保证云存储环境下语音文件的机密性,保护用户的隐私不被侵犯,并提高检索效率。
本发明的技术方案如下:
一种云存储环境下中文语音密文存储方法,适用于云服务端、服务端及用户端组成的网络系统,其步骤包括:
1)接收并识别用户端发送的语音文件,生成识别文本文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011138829.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大型锅炉管道自动焊接装置
- 下一篇:一种集成式电机液压制动器