[发明专利]一种语音处理的方法及装置有效
申请号: | 201410657804.9 | 申请日: | 2014-11-18 |
公开(公告)号: | CN105590629B | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 郭李;仇存收;刘立;田立生;常青;王金鑫 | 申请(专利权)人: | 华为终端(东莞)有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/16 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 523808 广东省东莞市松山湖高新技术产业开*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 | ||
一种语音处理的方法,用于解决现有技术中语音处理时误判率高的问题,所述方法包括:用户设备将获取的语音信号进行加窗和分帧;加重所述进行加窗和分帧后的语音信号中的高频谐波成分;根据快速傅立叶变换FFT获取所述加重高频谐波成分后的语音信号的频谱;计算所述频谱中各个频点的斜率;根据所述斜率确定所述语音信号的中心频点,并根据所述中心频点确定谐波。本发明实施例还提供一种语音处理的装置。
技术领域
本发明涉及通信领域,具体涉及一种语音处理方法及装置。
背景技术
在语音通信设备或高质量录音设备中,都需要用到语音编解码、语音前后处理、语音合成、语音识别等技术,所有这些对语音进行处理的技术都需要对语音信号进行分帧,然后逐帧进行处理,其中,谐波检测是语音处理的关键技术。
现有的谐波检测技术主要是应用自相关法,通过计算语音信号的自相关函数,并检测出现峰值的位置,进而确定谐波。
但是,应用自相关法进行谐波检测容易受到语音共振峰的干扰,导致谐波的误判率高。
发明内容
本发明实施例提供一种语音处理方法及装置,用于解决现有技术中语音处理时谐波误判率高的问题。
本发明第一方面提供一种语音处理的方法,包括:
用户设备将获取的语音信号进行加窗和分帧;
所述用户设备加重所述进行加窗和分帧后的语音信号中的高频谐波成分;
所述用户设备根据快速傅立叶变换FFT获取所述加重高频谐波成分后的语音信号的频谱;
所述用户设备计算所述频谱中各个频点的斜率;
所述用户设备根据所述斜率确定所述语音信号的中心频点,并根据所述中心频点确定谐波。
结合第一方面,在第一种可能的实现方式中,所述根据所述中心频点确定谐波之后还包括:
所述用户设备统计所述谐波的个数,并判断所述谐波的个数是否大于预设的阈值,若是,则确定所述语音信号存在语音。
结合第一方面,在第二种可能的实现方式中,所述根据所述中心频点确定谐波之后还包括:
所述用户设备通过计算相邻所述谐波的频率差,确定基音频率。
结合第一方面,在第三种可能的实现方式中,所述用户设备计算所述频谱中各个频点的斜率包括:
所述用户设备采用索贝尔sobel算子计算所述频谱中各个频点的斜率g,所述斜率g=A*B,其中,A为sobel算子,B为所述频谱的矩阵。
结合第一方面,在第四种可能的实现方式中,所述用户设备根据所述斜率确定所述语音信号的中心频点包括:
所述用户设备根据所述斜率获取中心频点的起始沿和下降沿,并通过所述起始沿和下降沿确定所述语音信号的中心频点。
结合第一方面,在第五种可能的实现方式中,所述用户设备通过计算相邻所述谐波的频率差,确定基音频率包括:
所述用户设备通过计算相邻所述谐波的频率差,并统计出现次数最多的频率差,将所述出现次数最多的频率差确定为所述基音频率。
结合第一方面,在第六种可能的实现方式中,所述用户设备计算所述频谱中各个频点的斜率之前还包括:
所述用户设备计算所述语音信号中高能量成分的对数谱XHE(t,f),所述高能量成分的对数谱其中,max为取最大值符号,XSTFT(t,f)为语音信号的频谱,SNN(t,f)为通过计算的背景噪声的频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端(东莞)有限公司,未经华为终端(东莞)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410657804.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢丝绳放绳器
- 下一篇:一种用于吊车安全限位的保护装置