[发明专利]一种用于保护汉语语音私密度的掩蔽信号的生成方法有效
申请号: | 201510094030.8 | 申请日: | 2015-03-03 |
公开(公告)号: | CN104637485B | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 李晔;马晓凤;郝秋赟;樊燕红;姜竞赛;张鹏 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G10L19/018 | 分类号: | G10L19/018 |
代理公司: | 济南泉城专利商标事务所37218 | 代理人: | 褚庆森 |
地址: | 250014 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 保护 汉语 语音 密度 掩蔽 信号 生成 方法 | ||
1.一种用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于,通过以下步骤来实现:
a).统计语句概率表,以具有代表性的汉语语料库为统计样本,对语料库中每个段落所包含的语句数进行统计,获得组成段落的语句数的概率表,简称语句概率表,其中表示语句数目为的段落占所有段落的百分比,1≤≤;
b).统计句段概率表,对语料库中所有语句所包含的句段数进行统计,获得语句的句段数的概率表,简称句段概率表,其中表示句段数目为的语句占所有语句的百分比,1≤≤;
c).统计词组概率表,对语料库中所有句段所包含的词组数进行统计,获得句段的词组数的概率表,简称词组概率表,其中表示词组数目为的句段占所有句段的百分比,1≤≤;
d).统计汉字概率表,对语料库中所有词组所包含的汉字数进行统计,获得词组的汉字数的概率表,简称汉字概率表,其中表示汉字数目为的词组占所有词组的百分比,1≤≤;
e).统计音节概率表,首先按照字母顺序对音节进行排序,记为,然后根据各音节在日常用语中出现的概率,获得音节概率表,简称音节概率表,其中表示音节在日常用语中出现的频率,1≤≤;
f).生成文本信息,按照如下步骤生成语音对应的文本信息:
f-1).确定自然段的语句数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出自然段中所包含的语句数为,其中,1≤≤,;通过步骤f-2)确定出自然段中的每个语句;
f-2).确定语句中的句段数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出语句中所包含的句段数为,其中,1≤≤,;通过步骤f-3)确定出每个语句中的句段;
f-3).确定句段中的词组数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出句段中所包含的词组数为,其中,1≤≤,;通过步骤f-4)确定每个句段中的词组;
f-4).确定词组中的汉字数,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出词组中所包含的汉字数为,汉字数即音节数,每个汉字对应一个音节,其中,1≤≤,;通过步骤f-5)确定每个汉字的音节;
f-5).确定音节,在区间范围内产生随机数,并判断随机数所属区间;如果在区间内,则得出汉字的音节为,其中,1≤≤,;直至词组中所有汉字的音节确定完毕;
按照步骤f-1)至f-5)生成自然段的文本信息,直至所生成的自然段数目满足要求;
g).语音合成,利用与每个音节的发音相对应的语音库,将步骤f)中获取的自然段的文本信息中的音节,与语音库中的发音一一对应形成相应的语音数据,通过在保密会议中的声音泄漏位置播放该语音数据,即可形成与正常发音的统计特性类似、掩蔽性好、对会议人员影响小的语音掩蔽信号。
2.根据权利要求1所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤f)在语音文本信息的生成过程中,语句末的符号为句号、问号或感叹号,句段末的符号为冒号、逗号或分号,段末的符号为回车或换行符;在文本信息生成发音数据的过程中,自然段之间、各语句之间以及各句段之间均加入静音段。
3.根据权利要求1或2所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤a)、b)、c)、d)中语句概率、句段概率、词组概率、汉字概率均精确至0.01,步骤e)中的音节概率精确至0.0001。
4.根据权利要求1或2所述的用于保护汉语语音私密度的掩蔽信号的生成方法,其特征在于:步骤a)中所述的语料库为国家语委立项建设的现代汉语通用平衡语料库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510094030.8/1.html,转载请声明来源钻瓜专利网。