[发明专利]一种基于长时帧背景噪声估计的语音情感特征提取方法在审

申请号：	201810017241.5	申请日：	2018-01-09
公开（公告）号：	CN108364641A	公开（公告）日：	2018-08-03
发明（设计）人：	黄永明;田可心;马自应	申请（专利权）人：	东南大学
主分类号：	G10L15/20	分类号：	G10L15/20;G10L21/02;G10L21/0216;G10L25/18;G10L25/21;G10L25/24;G10L25/45;G10L25/63
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	柏尚春
地址：	210000 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于长时帧背景噪声估计的语音情感特征提取方法，该方法在小波包基分解的频带上，利用非对称噪声抑制对语音信号进行噪声补偿，从而减小噪声对语音情感特征识别能力的影响，最后对特征能量进行频谱质心加权，进一步增加了提取特征的噪声鲁棒性。本发明通过对与语音信号进行小波包基分解，得到能够表征语音中蕴含的情感信息的一组频带，利用非对称噪声抑制对语音信号进行噪声补偿，最后利用对噪声具有鲁棒性的频谱质心对提取的特征能量进行加权，提高了提取的语音情感特征的语音情感识别率以及噪声鲁棒性。
搜索关键词：	语音情感语音信号背景噪声估计非对称噪声噪声鲁棒性特征能量特征提取噪声补偿小波包长时频谱质心加权噪声分解表征语音情感信息特征识别提取特征鲁棒性识别率组频带减小
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于长时帧背景噪声估计的噪声鲁棒语音情感特征提取方法，其特征在于，该方法包括以下步骤：在麦克风里输入语音信号后，步骤1：对输入的语音信号进行预处理，得到有效语音帧集合；步骤2：对有效语音帧集合中的各语音帧s_k进行小波包分解，得到小波包树并对全体叶节点进行频率排序，得到小波包系数集合其中为最优小波包树，j是语音信号2倍采样的次数，p是小波包节点的序号，表示排序后小波包树的节点序列；步骤3：计算语音帧sk在各个子频带的能量分量Ei：步骤4：计算子频带长时帧长能量其中x表示语音帧序号，i表示子频带序号，参数M＝2；步骤5：利用非对称噪声抑制进行噪声补偿；步骤6：谱权重平滑化；步骤7：采用自回归谱估计方法对语音帧s_k在各个子频带内的功率谱P_i(f)进行估计；步骤8：计算语音帧在各子频带内的子带频谱质心C_i；其中，λ是控制功率谱幅值动态范围的控制因子；步骤9：由子带频谱质心计算权重wi,i＝1,2,…,I：步骤10：用权重wi,i＝1,2,…,I对相应子频带的对数子带能量进行加权，得到加权的子带能量WLi：WLi＝wi·lg(T[x,i])步骤11：对加权子带能量WLi进行离散余弦变换，得到L阶的子带频谱质心加权的噪声鲁棒的小波包倒谱系数LW‑WPCC：其中l是小波包倒谱系数LW‑WPCC的阶次序号；最后将语音帧的对数能量作为0阶LW‑WPCC系数，与所提取的L阶LW‑WPCC特征共同构成(L+1)维的特征向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810017241.5/，转载请声明来源钻瓜专利网。

上一篇：一种基于TensorFlow框架的机器人远程语音控制系统
下一篇：一种声源锁定方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于长时帧背景噪声估计的语音情感特征提取方法在审

专利文献下载