[发明专利]一种用于对说话人识别的前端语音增强方法在审
申请号: | 201610008120.5 | 申请日: | 2016-01-07 |
公开(公告)号: | CN105427859A | 公开(公告)日: | 2016-03-23 |
发明(设计)人: | 李昕;朱杰 | 申请(专利权)人: | 深圳市音加密科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/20;G10L17/14 |
代理公司: | 岳阳市科明专利事务所 43203 | 代理人: | 彭乃恩;陈庆元 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 说话 识别 前端 语音 增强 方法 | ||
技术领域
本发明涉及语音信号处理领域,特别指一种用于对说话人识别的前端语音增强方法。
背景技术
说话人识别是一种通过特定人说话的语音对其身份进行识别的技术。但由于实际环境中存在各种各样的噪声,说话人识别系统的性能会显著降低。在前端加入合适的语音增强模块可以有效地提高整体系统的识别率,以提高系统对噪声的鲁棒性。然而实际情况下,语音增强算法无法完全恢复纯净的语音信号,而且由于算法本身的缺陷会带来残留噪声和语音失真。对于说话人识别技术来说,它利用语音中蕴含的说话人特征信息对说话人的身份进行识别,因而对语音失真十分敏感,所以针对说话人识别系统的前段语音增强方法不同于常规的语音增强方法,需要进行相应的调整,以达到最佳的系统识别效果。
单通道语音增强是一种对带噪语音信号进行分析处理,估计得到纯净语音信号的处理技术。实际环境中的噪声信号通常是高度非平稳信号,其噪声能量在频谱上分布极不均匀,且随时间快速变化,在此情况下对噪声的估计和相应的语音信号恢复都是十分困难的。常规的语音增强方法有谱减法、维纳滤波法、信号子空间分离方法和统计模型方法等,它们各有优势与不足之处,往往会根据实际应用场景做相应的选择或融合。谱减法是一种实现简单快速但效果显著的语音增强算法,以其为基础的各种改进方法目前也在语音处理系统中被广泛使用。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于听觉掩蔽阈值和参数自适应的改进谱减法,通过掩蔽阈值来保证语音失真度最小化,从而既能提高说话人识别系统的抗噪声性能,又尽可能地达到对语音特征损伤最小的用于对说话人识别的前端语音增强方法。
本发明解决该技术问题所采用的技术方案如下:一种用于对说话人识别的前端语音增强方法,包括以下步骤:
第一步,对输入语音信号进行分帧、加窗,对每一帧用FFT计算短时功率谱和相位谱;
第二步,利用语音帧的短时功率谱进行估计,采用改进最小控制递归平均算法估计噪声的功率谱;
该估计算法通过两次平滑,两次最小值搜索和计算语音存在概率得出最终的噪声功率谱结果,功率谱平滑公式和最小值搜索方法如下所示:
而语音存在概率通过第一次平滑的结果和先验后验信噪比得出,公式如下:
上述公式中,分别为频带序号和帧序号,为语音不存在的概率,分别为先验和后验信噪比,而;
最后根据语音存在的概率估计噪声功率谱:
第三步,用估计得到的噪声功率谱做初步降噪,采用的降噪方法为多频带谱减法,得到初步的增强语音功率谱,多频带谱减法的公式如下所示:
其中过减因子和控制因子随子频带信噪比和频率进行自适应调整;
第四步,利用初步增强语音功率谱计算听觉掩蔽阈值,具体是计算Bark子带的功率谱,后用扩散函数进行扩散后得到扩散功率谱:
之后再利用谱平坦度判决子带的语音存在概率,以此调整得到掩蔽阈值:
最后与绝对听域比较得到最终的掩蔽阈值:
第五步,利用听觉掩蔽阈值调整过减因子和谱减系数,进行第二次谱减法,最后用IFFT得到最终的增强信号,过减因子和谱减系数的调整公式如下:
而采用自适应参数调整的谱减法公式如下所示:
。
优选地,所述的最大过减因子具体为;且为掩蔽阈值设置了浮动范围,以防止参数变化过大,使得语音特征能最大程度地保留。
优选地,上述步骤中所采用的硬件设备为PC机。
优选地,上述的用于说话人识别系统的前端语音增强方法,经过实验检验,在信噪比输出和说话人识别系统的性能提升方面,均比常规谱减法有很大改善。
本发明的有益效果在于:
本发明与常规的谱减法相比,在说话人识别系统前端处理上具有实质性特点和显著进步,具体体现如下:
(1)本发明以传统谱减法为基础,提出了结合最小控制递归平均噪声估计过程及计算听觉掩蔽阈值的改进型二次谱减法,能自适应调整谱减法中涉及的各项参数,以保证语音增强后的语音失真最小化,从而使处理后的语音信号在说话人识别系统中有良好的表现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市音加密科技有限公司,未经深圳市音加密科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610008120.5/2.html,转载请声明来源钻瓜专利网。