[发明专利]基于相关函数最大值的广播语音与噪声检测的方法在审
申请号: | 201910171860.4 | 申请日: | 2019-03-07 |
公开(公告)号: | CN109785866A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 袁三男;刘虹 | 申请(专利权)人: | 上海电力学院 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L25/78 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐颖 |
地址: | 200090 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相关函数 语音信号 方差 广播语音 噪声检测 分帧 语音 互相关函数 声音处理 噪声识别 阈值常数 噪声 判定 广播 | ||
本发明涉及一种基于相关函数最大值的广播语音与噪声检测的方法,通过对语音信号进行分帧;根据自(互)相关函数公式进行每帧语音信号相关函数计算;求取分帧每帧语音信号的自(互)相关函数或互相关函数的最大值;计算一秒内自(互)相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判断为语音,最大值方差小于Th时,便判定为噪声。此方法将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
技术领域
本发明涉及一种语音识别技术,特别涉及一种基于相关函数最大值的广播语音与噪声检测的方法。
背景技术
调频广播中经常听到“呲呲”的声音,是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。现实生活中,一些人的声音和这些噪声极为相似,因此,使用傅里叶变换就很难将这些噪声和语音区分开来。
发明内容
本发明是针对调频广播中嘈杂声难识别区分的问题,提出了一种基于相关函数最大值的广播语音与噪声检测的方法,正确将噪声识别区分出。
本发明的技术方案为:一种基于相关函数最大值的广播语音与噪声检测的方法,具体包括如下步骤:
1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;
2)根据自相关函数公式进行每帧语音信号自相关函数计算,根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算;
3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值;
4)计算一秒内自相关函数或互相关函数的最大值方差,任取自相关函数的最大值的方差或互相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判断为语音,最大值方差小于Th时,便判定为噪声;
5)进行下一秒内自相关函数或互相关函数的最大值方差,同步骤4)进行同样判断方法判定噪声,直到步骤1)分帧后的输入语音信号全部判定完毕。
所述步骤2)中自相关函数公式为:
所述互相关函数公式为:
其中xi(m)为第i帧的语音信号中的第m个数据;xi-1(m)为第i-1帧的语音信号中的第m个数据;k为延迟量,k=0,1,2,…,L-1;L为语音分帧后每帧的长度。
本发明的有益效果在于:本发明基于相关函数最大值的广播语音与噪声检测的方法,将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。解决高斯噪声中高幅值部分的失真引起的噪声难以区别的问题。
附图说明
图1为本发明基于相关函数最大值的广播语音与噪声检测流程图。
具体实施方式
如图1所示基于相关函数的最大值的广播语音和噪声检测流程图,具体包括如下步骤:
1、对输入的语音信号进行分帧:由于语音信号是一个非稳态、时变的信号,但是可以在“短时间”范围内认为语音信号是稳态的,时不变的。这个短时间一般指10~30ms,本发明采用的帧长为20ms;
2、求每帧语音信号的短时自相关函数:下标i表示为第i帧,每帧数据的短时自(互)相关函数,自相关函数定义为公式(1),互相关函数的公式为公式(2);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力学院,未经上海电力学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910171860.4/2.html,转载请声明来源钻瓜专利网。