[发明专利]根据频域能量对语音信号进行处理的方法和装置有效
申请号: | 201410098869.4 | 申请日: | 2014-03-17 |
公开(公告)号: | CN104934032B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 许丽净 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L21/0208;G10L25/93 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种根据频域能量对语音信号进行处理的方法和装置。本发明的根据频域能量对语音信号进行处理的方法和装置包括:接收包括相邻的第一语音帧和第二语音帧的原始语音信号;分别对所述第一语音帧和所述第二语音帧进行傅里叶变换得到第一频域信号和第二频域信号,并得到所述第一语音帧和所述第二语音帧的频域能量分布;然后得到所述第一语音帧和所述第二语音帧的频域能量相关性系数;根据所述频域能量相关性系数对所述原始语音信号进行分段。本发明实施例可以解决在进行语音信号精细分段时,由于语音信号音素本身的特征或是较强噪声的影响,导致语音信号分段结果准确性不高的问题。 | ||
搜索关键词: | 语音帧 语音信号 频域能量 方法和装置 分段 原始语音信号 频域信号 频域能量分布 傅里叶变换 结果准确性 强噪声 音素 精细 | ||
【主权项】:
1.一种根据频域能量对语音信号进行处理的方法,其特征在于,所述方法包括:接收原始语音信号,所述原始语音信号包括相邻的第一语音帧和第二语音帧;对所述第一语音帧进行傅里叶变换得到第一频域信号,对所述第二语音帧进行傅里叶变换得到第二频域信号;根据所述第一频域信号得到所述第一语音帧的频域能量分布,根据所述第二频域信号得到所述第二语音帧的频域能量分布,其中,所述频域能量分布表示语音帧在频域上的能量分布特性;根据所述第一语音帧的频域能量分布和所述第二语音帧的频域能量分布,得到所述第一语音帧和所述第二语音帧的频域能量相关性系数,其中,所述频域能量相关性系数用于表示所述第一语音帧到所述第二语音帧的频谱变化;根据所述频域能量相关性系数对所述原始语音信号进行分段;所述第一语音帧的频率范围内包括至少两个频段,所述根据所述第一频域信号得到所述第一语音帧的频域能量分布,具体包括:根据所述第一频域信号的实部和所述第一频域信号的虚部,得到所述第一语音帧的任一所述频段范围内的能量总和与所述第一语音帧的总能量的第一比值;对所述第一比值进行求导,得到第一导数表示所述第一语音帧的频域能量分布。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410098869.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种IC卡交易方法及系统
- 下一篇:食材混合机