[发明专利]一种用于保护汉语语音私密度的掩蔽信号的生成方法有效

专利信息
申请号: 201510094030.8 申请日: 2015-03-03
公开(公告)号: CN104637485B 公开(公告)日: 2018-05-01
发明(设计)人: 李晔;马晓凤;郝秋赟;樊燕红;姜竞赛;张鹏 申请(专利权)人: 山东省计算中心(国家超级计算济南中心)
主分类号: G10L19/018 分类号: G10L19/018
代理公司: 济南泉城专利商标事务所37218 代理人: 褚庆森
地址: 250014 山东省济*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 保护 汉语 语音 密度 掩蔽 信号 生成 方法
【权利要求书】:

1.一种用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于,通过以下步骤来实现:

a).统计语句概率表,以具有代表性的汉语语料库为统计样本,对语料库中每个段落所包含的语句数进行统计,获得组成段落的语句数的概率表,简称语句概率表,其中表示语句数目为的段落占所有段落的百分比,1≤≤;

b).统计句段概率表,对语料库中所有语句所包含的句段数进行统计,获得语句的句段数的概率表,简称句段概率表,其中表示句段数目为的语句占所有语句的百分比,1≤≤;

c).统计词组概率表,对语料库中所有句段所包含的词组数进行统计,获得句段的词组数的概率表,简称词组概率表,其中表示词组数目为的句段占所有句段的百分比,1≤≤;

d).统计汉字概率表,对语料库中所有词组所包含的汉字数进行统计,获得词组的汉字数的概率表,简称汉字概率表,其中表示汉字数目为的词组占所有词组的百分比,1≤≤;

e).统计音节概率表,首先按照字母顺序对音节进行排序,记为,然后根据各音节在日常用语中出现的概率,获得音节概率表,简称音节概率表,其中表示音节在日常用语中出现的频率,1≤≤;

f).生成文本信息,按照如下步骤生成语音对应的文本信息:

f-1).确定自然段的语句数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出自然段中所包含的语句数为,其中,1≤≤,;通过步骤f-2)确定出自然段中的每个语句;

f-2).确定语句中的句段数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出语句中所包含的句段数为,其中,1≤≤,;通过步骤f-3)确定出每个语句中的句段;

f-3).确定句段中的词组数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出句段中所包含的词组数为,其中,1≤≤,;通过步骤f-4)确定每个句段中的词组;

f-4).确定词组中的汉字数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出词组中所包含的汉字数为,汉字数即音节数,每个汉字对应一个音节,其中,1≤≤,;通过步骤f-5)确定每个汉字的音节;

f-5).确定音节,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出汉字的音节为,其中,1≤≤,;直至词组中所有汉字的音节确定完毕;

按照步骤f-1)至f-5)生成自然段的文本信息,直至所生成的自然段数目满足要求;

g).语音合成,利用与每个音节的发音相对应的语音库,将步骤f)中获取的自然段的文本信息中的音节,与语音库中的发音一一对应形成相应的语音数据,通过在保密会议中的声音泄漏位置播放该语音数据,即可形成与正常发音的统计特性类似、掩蔽性好、对会议人员影响小的语音掩蔽信号。

2.根据权利要求1所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤f)在语音文本信息的生成过程中,语句末的符号为句号、问号或感叹号,句段末的符号为冒号、逗号或分号,段末的符号为回车或换行符;在文本信息生成发音数据的过程中,自然段之间、各语句之间以及各句段之间均加入静音段。

3.根据权利要求1或2所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤a)、b)、c)、d)中语句概率、句段概率、词组概率、汉字概率均精确至0.01,步骤e)中的音节概率精确至0.0001。

4.根据权利要求1或2所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤a)中所述的语料库为国家语委立项建设的现代汉语通用平衡语料库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510094030.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top