[发明专利]一种用于对说话人识别的前端语音增强方法在审
申请号: | 201610008120.5 | 申请日: | 2016-01-07 |
公开(公告)号: | CN105427859A | 公开(公告)日: | 2016-03-23 |
发明(设计)人: | 李昕;朱杰 | 申请(专利权)人: | 深圳市音加密科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/20;G10L17/14 |
代理公司: | 岳阳市科明专利事务所 43203 | 代理人: | 彭乃恩;陈庆元 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于对说话人识别系统的前端语音增强方法。该方法以传统谱减法为基础,结合非平稳噪声估计算法,并通过多频带谱减法得到初步增强的语音去计算听觉掩蔽阈值,从而自适应地调整谱减法的相关参数,得到一种适用于说话人识别系统的前端处理器,相比常规的语音增强算法,本发明既能提高说话人识别系统的抗噪声性能,又能通过调整参数来最大程度降低语音失真,保持说话人的语音特征,从而使说话人识别系统在噪声环境下的识别率得到有效提升。 | ||
搜索关键词: | 一种 用于 说话 识别 前端 语音 增强 方法 | ||
【主权项】:
一种用于对说话人识别的前端语音增强方法,包括以下步骤:第一步,对输入语音信号进行分帧、加窗,对每一帧用FFT计算短时功率谱和相位谱;第二步,利用语音帧的短时功率谱进行估计,采用改进最小控制递归平均算法估计噪声的功率谱;该估计算法通过两次平滑,两次最小值搜索和计算语音存在概率得出最终的噪声功率谱结果,功率谱平滑公式和最小值搜索方法如下所示:而语音存在概率通过第一次平滑的结果和先验后验信噪比得出,公式如下:上述公式中,分别为频带序号和帧序号,为语音不存在的概率,分别为先验和后验信噪比,而;最后根据语音存在的概率估计噪声功率谱:第三步,用估计得到的噪声功率谱做初步降噪,采用的降噪方法为多频带谱减法,得到初步的增强语音功率谱,多频带谱减法的公式如下所示:其中过减因子和控制因子随子频带信噪比和频率进行自适应调整方式如下:第四步,利用初步增强语音功率谱计算听觉掩蔽阈值,具体是计算Bark子带的功率谱,后用扩散函数进行扩散后得到扩散功率谱:之后再利用谱平坦度判决子带的语音存在概率,以此调整得到掩蔽阈值:最后与绝对听域比较得到最终的掩蔽阈值:第五步,利用听觉掩蔽阈值调整过减因子和谱减系数,进行第二次谱减法,最后用IFFT得到最终的增强信号,过减因子和谱减系数的调整公式如下:而采用自适应参数调整的谱减法公式如下所示:。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市音加密科技有限公司,未经深圳市音加密科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610008120.5/,转载请声明来源钻瓜专利网。