[发明专利]一种基于长时帧背景噪声估计的语音情感特征提取方法在审

专利信息
申请号: 201810017241.5 申请日: 2018-01-09
公开(公告)号: CN108364641A 公开(公告)日: 2018-08-03
发明(设计)人: 黄永明;田可心;马自应 申请(专利权)人: 东南大学
主分类号: G10L15/20 分类号: G10L15/20;G10L21/02;G10L21/0216;G10L25/18;G10L25/21;G10L25/24;G10L25/45;G10L25/63
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于长时帧背景噪声估计的语音情感特征提取方法,该方法在小波包基分解的频带上,利用非对称噪声抑制对语音信号进行噪声补偿,从而减小噪声对语音情感特征识别能力的影响,最后对特征能量进行频谱质心加权,进一步增加了提取特征的噪声鲁棒性。本发明通过对与语音信号进行小波包基分解,得到能够表征语音中蕴含的情感信息的一组频带,利用非对称噪声抑制对语音信号进行噪声补偿,最后利用对噪声具有鲁棒性的频谱质心对提取的特征能量进行加权,提高了提取的语音情感特征的语音情感识别率以及噪声鲁棒性。
搜索关键词: 语音情感 语音信号 背景噪声估计 非对称噪声 噪声鲁棒性 特征能量 特征提取 噪声补偿 小波包 长时 频谱 质心 加权 噪声 分解 表征语音 情感信息 特征识别 提取特征 鲁棒性 识别率 组频带 减小
【主权项】:
1.一种基于长时帧背景噪声估计的噪声鲁棒语音情感特征提取方法,其特征在于,该方法包括以下步骤:在麦克风里输入语音信号后,步骤1:对输入的语音信号进行预处理,得到有效语音帧集合;步骤2:对有效语音帧集合中的各语音帧sk进行小波包分解,得到小波包树并对全体叶节点进行频率排序,得到小波包系数集合其中为最优小波包树,j是语音信号2倍采样的次数,p是小波包节点的序号,表示排序后小波包树的节点序列;步骤3:计算语音帧sk在各个子频带的能量分量Ei:步骤4:计算子频带长时帧长能量其中x表示语音帧序号,i表示子频带序号,参数M=2;步骤5:利用非对称噪声抑制进行噪声补偿;步骤6:谱权重平滑化;步骤7:采用自回归谱估计方法对语音帧sk在各个子频带内的功率谱Pi(f)进行估计;步骤8:计算语音帧在各子频带内的子带频谱质心Ci其中,λ是控制功率谱幅值动态范围的控制因子;步骤9:由子带频谱质心计算权重wi,i=1,2,…,I:步骤10:用权重wi,i=1,2,…,I对相应子频带的对数子带能量进行加权,得到加权的子带能量WLi:WLi=wi·lg(T[x,i])步骤11:对加权子带能量WLi进行离散余弦变换,得到L阶的子带频谱质心加权的噪声鲁棒的小波包倒谱系数LW‑WPCC:其中l是小波包倒谱系数LW‑WPCC的阶次序号;最后将语音帧的对数能量作为0阶LW‑WPCC系数,与所提取的L阶LW‑WPCC特征共同构成(L+1)维的特征向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810017241.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top