[发明专利]一种针对声纹识别的语音降噪方法及装置有效
申请号: | 201810065088.3 | 申请日: | 2018-01-23 |
公开(公告)号: | CN110070874B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 颜永红;王文超;徐及 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/10;G10L21/0208 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 声纹 识别 语音 方法 装置 | ||
本发明涉及一种针对声纹识别的语音降噪方法及装置,该方法包括:对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号;对第一模态信号进行降噪,获取降噪后的模态信号;将降噪后的模态信号与所述除所述第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。通过该方案,主要是分离出噪声最多的模态进行降噪处理。如此一来,在实现语音信号降噪处理的同时,还可以尽量避免了有效语音信号的损失,即说话人语音信息的损失,提升声纹识别效果。
技术领域
本发明涉及信号处理技术领域,特别涉及一种针对声纹识别的语音降噪方法及装置。
背景技术
随着现代社会信息的全球化,声纹识别成为语音识别技术研究热点之一。随着互联网的普及,网上用户登录、网上支付等也面临着一定的风险,声纹密码可以在原有密码基础上增加账户的安全性。声纹识别在实际应用中由于周围环境嘈杂,含有较多噪音含量,导致识别效果不佳。这里的噪声主要包括环境噪声和信道噪声。当前,如何提高噪声条件下的声纹识别效果,已经成为了亟待解决的技术问题。
发明内容
本发明的目的在于,克服现阶段对于含有较高噪音的语音信号进行声纹识别的问题,提供一种针对声纹识别的语音降噪方法及装置。
为解决上述技术问题,本发明的技术方案所提供的一种针对声纹识别的语音降噪方法,该方法包括:
将第一有效语音信号转换为第一时频域特征,具体包括:
对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;
对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号,其中第一模态信号为包含噪声能量最多的模态信号;
对第一模态信号进行降噪,获取降噪后的模态信号;
将降噪后的模态信号与除第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。
本发明提供的一种针对声纹识别的语音降噪方法,优点在于:对具有噪声的语音信号进行预处理后,进行特征提取,获取第一语音功率谱图后,对第一语音功率谱图进行分解,获取第一模态信号和其他模态信号。其中,第一模态信号为含有噪声能量最多的模态信号。因此,只要对第一模态信号进行降噪,然后与其他模态信号进行相加重构即可。通过该方案,主要是分离出噪声最多的模态进行降噪处理。如此一来,在实现语音信号降噪处理的同时,还可以尽量避免了有效语音信号的损失,即说话人语音信息的损失,提升声纹识别效果。
作为上述方法的又一种改进,对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图,具体包括:
将具有噪声的语音信号转换为数字信号;
对数字信号进行特征提取,获取第一语音功率谱图。
作为上述方法的再一种改进,对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号,具体包括:
采用集合经验模态分解方法对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号。
采用上述进一步方案的有益效果是:采用集合经验模态分解方法对第一语音功率谱图进行分解时,获取的第一模态信号将会是含有最多噪声能量的模态信号。其他模态信号将仅包含极少的噪声能量,对应声纹识别不会造成影响。因此,在后续处理过程中,只要对第一模态信号进行降噪即可。无需对其他模态信号进行降噪处理。
作为上述方法的还一种改进,对第一模态信号进行降噪,获取降噪后的模态信号,具体包括:
采用小波降噪方法对第一模态信号进行降噪,获取降噪后的模态信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810065088.3/2.html,转载请声明来源钻瓜专利网。