[发明专利]基于径向基神经网络的耳语音转换为正常语音的方法无效
申请号: | 200910025321.6 | 申请日: | 2009-03-10 |
公开(公告)号: | CN101527141A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 陶智;赵鹤鸣;顾济华;韩韬;陈大庆;许宜申;吴迪;张晓俊 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 苏州创元专利商标事务所有限公司 | 代理人: | 陶海锋 |
地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 径向 神经网络 耳语 转换 正常 语音 方法 | ||
技术领域
本发明属于语音信号处理技术领域,特别涉及耳语音转换为正常语音技术。
背景技术
耳语音是一种有别于正常语音的发音模式,其主要特点是发音时音量低且声带完全不振动。在某些场合说话时,人们为了不影响他人或为了对话的保密性,常常使用耳语方式。然而由于耳语发音的特殊性和受对话环境的影响,这种方式下的语音信号不仅信噪比低而且可懂度、清晰度都较差,特别是在通过通讯设备进行交流时,既影响通话质量,又易使人产生疲劳。另外一些嗓音病人或发音功能不正常者交流时也只能使用耳语方式,影响了交流。
目前国内外关于耳语音转换的研究较少,已有的方法有:1、使用线性预测法(LPC)实现耳语音的重建,通过提取耳语音的偏相关系数构成斜格型合成滤波器进行合成,其遇到的问题,一是耳语音的共振峰不易提取,二是在该方法中,认为耳语音与正常语音的共振峰结构大致不变,但实际上耳语音的共振峰频率是向高频偏移的,所以恢复出的语音往往不能让人准确听辨;2、采用混合激励线性预测模型(MELP)重建耳语音,将语音分为五个频带,并将四个低频带作为浊音段激励,高频段作为清音段激励,这样重建的语音带有明显的失真;3、基于同态信号处理方法并结合相对熵声韵分割的耳语重建系统,在对耳语音声韵分割后,使用同态信号处理方法得到声道响应序列,根据音调加入基频,由于耳语音传输函数有别于正常语音,虽然经过了一些后处理但是转换语音的自然度不高。
发明内容
本发明目的是提供一种将耳语音转换为正常语音的方法,使得恢复的语音在可懂度以及音质上均达到比较好的效果,以更方便人们的交流。
为达到上述目的,本发明采用的技术方案是:一种基于径向基神经网络的耳语音转换为正常语音的方法,包括训练步骤和转换步骤,
所述训练步骤为,分别提取出相同发音内容的耳语音和正常语音的线谱对参数,使用径向基神经网络对耳语音、正常语音的线谱对参数进行训练,捕获耳语音、正常语音频谱包络的映射关系;
所述转换步骤为,提取待转换的耳语音的线谱对参数,使用已训练好的径向基神经网络进行转换,获得对应于正常语音的线谱对参数,并使用线谱对参数合成器转换出正常语音。
上文中,通过使用径向基神经网络,创造性地提出了利用耳语音和正常语音的线谱对参数间的关联性,实现耳语音和正常语音的转换。其中,在获得正常语音的线谱对参数后,用线谱对参数合成器进行合成转换出正常语音是现有技术。进行语音合成时,需要提供激励源,激励源分为浊音源和清音源两种,发浊音时声带不断张开和关闭,将产生间歇的脉冲波。这个脉冲的波形类似于斜三角的脉冲。它的数学表达式如下:
式中,N1=0.5N为斜三角波上升部分的时间,N2=0.35N为其下降部分的时间,N为语音基音周期的时间。选取语音基频平均值为基音频率。
发清音时,无论是发阻塞音或摩擦音,声道都被阻碍形成湍流。所以,可以把清音激励模拟成随机白噪声。实际情况下一般使用均值为0的、方差为1的,并在时间或/和幅值上为白色分布的序列。
利用上述激励源,将经过已训练径向基神经网络转换后的耳语音线谱对参数构成合成器,通过线谱对参数合成器转换出正常语音。
上述技术方案中,所述训练步骤中,获取耳语音的线谱对参数的方法为,获取采样率不低于10KHz的音频文件,进行下列处理,
(1)预处理:先采用一阶数字滤波器进行预加重处理,所述一阶数字滤波器为H(z)=1-uz-1,式中,H是传递函数,z是z变换,u为预加重系数,其取值为0.9<u<1;
再进行分帧加窗处理,每帧时间长度为20~30毫秒,帧长取2的整数次方,帧移与帧长的比值为1/4~1/2,采用汉明窗进行加窗处理,
式中,n为加窗点,N为汉明窗的窗长,w为汉明窗;
(2)线谱对分析:对经过预处理后的耳语音提取线谱对参数(wi、θi),并且wi、θi按下式关系排列:
0<w1<θ1<…<wp/2<θ p/2<π,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910025321.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型电子报警防盗方法及系统
- 下一篇:充电控制电路