[发明专利]一种语音处理的方法及装置有效
申请号: | 201410657804.9 | 申请日: | 2014-11-18 |
公开(公告)号: | CN105590629B | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 郭李;仇存收;刘立;田立生;常青;王金鑫 | 申请(专利权)人: | 华为终端(东莞)有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/16 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 523808 广东省东莞市松山湖高新技术产业开*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 | ||
1.一种语音处理的方法,其特征在于,包括:
用户设备将获取的语音信号进行加窗和分帧;
所述用户设备加重所述进行加窗和分帧后的语音信号中的高频谐波成分;
所述用户设备根据快速傅立叶变换FFT获取所述加重高频谐波成分后的语音信号的频谱;
所述用户设备计算所述频谱中各个频点的斜率;
所述用户设备根据所述斜率确定所述语音信号的中心频点,并根据所述中心频点确定谐波。
2.根据权利要求1所述的方法,其特征在于,所述根据所述中心频点确定谐波之后还包括:
所述用户设备统计所述谐波的个数,并判断所述谐波的个数是否大于预设的阈值,若是,则确定所述语音信号存在语音。
3.根据权利要求1所述的方法,其特征在于,所述根据所述中心频点确定谐波之后还包括:
所述用户设备通过计算相邻所述谐波的频率差,确定基音频率。
4.根据权利要求1所述的方法,其特征在于,所述用户设备计算所述频谱中各个频点的斜率包括:
所述用户设备采用索贝尔sobel算子计算所述频谱中各个频点的斜率g,所述斜率g=A*B,其中,A为sobel算子,B为所述频谱的矩阵。
5.根据权利要求1所述的方法,其特征在于,所述用户设备根据所述斜率确定所述语音信号的中心频点包括:
所述用户设备根据所述斜率获取中心频点的起始沿和下降沿,并通过所述起始沿和下降沿确定所述语音信号的中心频点。
6.根据权利要求3所述的方法,其特征在于,所述用户设备通过计算相邻所述谐波的频率差,确定基音频率包括:
所述用户设备通过计算相邻所述谐波的频率差,并统计出现次数最多的频率差,将所述出现次数最多的频率差确定为所述基音频率。
7.根据权利要求1所述的方法,其特征在于,所述用户设备计算所述频谱中各个频点的斜率之前还包括:
所述用户设备计算所述语音信号中高能量成分的对数谱XHE(t,f),所述高能量成分的对数谱其中,max为取最大值符号,XSTFT(t,f)为语音信号的频谱,SNN(t,f)为通过计算的背景噪声的频谱。
8.根据权利要求1所述的方法,其特征在于,所述用户设备加重所述进行加窗和分帧后的语音信号中的高频谐波成分包括:
所述用户设备采用低阶的高通滤波器加重所述进行加窗和分帧后的语音信号中的高频谐波成分。
9.一种语音处理的装置,其特征在于,包括:
加窗和分帧模块,用于将获取的语音信号进行加窗和分帧;
加重模块,用于在所述加窗和分帧模块将获取的语音信号进行加窗和分帧后,加重所述进行加窗和分帧后的语音信号中的高频谐波成分;
获取模块,用于在所述加重模块加重所述高频谐波成分后,根据FFT获取所述加重高频谐波成分后的语音信号的频谱;
第一计算模块,用于在所述获取模块获取所述加重高频谐波成分后的语音信号的频谱后,计算所述频谱中各个频点的斜率;
第一确定模块,用于在所述第一计算模块计算所述频谱中各个频点的斜率后,根据所述斜率确定所述语音信号的中心频点,并根据所述中心频点确定谐波。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
统计模块,用于在所述第一确定模块确定所述语音信号的中心频点后,并根据所述中心频点确定谐波后,统计所述谐波的个数;
判断模块,用于在所述统计模块统计所述谐波的个数后,判断所述谐波的个数是否大于预设的阈值;
第二确定模块,用于当所述判断模块判断所述谐波的个数大于预设的阈值时,则确定所述语音信号存在语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端(东莞)有限公司,未经华为终端(东莞)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410657804.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钢丝绳放绳器
- 下一篇:一种用于吊车安全限位的保护装置