[发明专利]一种儿童语音情感识别方法有效
申请号: | 200810148844.5 | 申请日: | 2008-09-27 |
公开(公告)号: | CN101685634A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 李立志;韩笑蕾;贾晓光;郭亮杰;徐锡涛 | 申请(专利权)人: | 上海盛淘智能科技有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L13/02 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 | 代理人: | 孙皓晨;朱世定 |
地址: | 200092上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 儿童 语音 情感 识别 方法 | ||
1.一种儿童语音情感识别方法,包括训练语音库建立、分类器训练和情感 识别,其特征在于,所述分类器训练包括以下步骤:
(S10)提取儿童语音情感特征,该步骤包括:
前端处理:对模拟语音信号进行包括采样和去噪基本信号处理在内的预处 理;之后对经过预处理的情感语句做HHT变换,获得情感语音的Hilbert谱;
根据HHT变换和所述情感语音的Hilbert谱进行以下特征提取:音强特征提 取、语调特征提取、音色特征提取和节奏特征提取,获得情感特征;
(S20)对提取到的情感特征进行降维,获得不同情感空间的四元特征;
(S30)通过将每个四元特征变换为自然情感状态的四元特征这一基准在各 个情感空间中的四元特征的投影值,来进行四元特征情感转换计算,对训练语 音库样本集都做上述转换计算,得到一系列的自然情感状态的四元特征在各个 情感空间上的投影,从而构成情感特征投影集;
(S40)用所述情感特征投影集中的数据进行SVM/HMM混合系统分类训 练。
2.根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述训练 语音库建立是针对变声期之前的儿童进行语音信息采样,并将儿童语音分为来 自活泼性格和羞涩性格儿童两类,针对不同性格的儿童分别进行分类器训练和 情感识别。
3.根据权利要求2所述的儿童语音情感识别方法,其特征在于,所述训练 语音库的建立是将儿童语音分为惊奇、骄傲、兴奋、快乐、心虚、伤心、厌恶、 焦急、恐惧、生气、平静11类情感。
4.根据权利要求1所述的儿童语音情感识别方法,其特征在于,所述步骤 (S10)中对经过预处理的情感语句做HHT变换的步骤包括:对情感语句进行 EMD分解,得到一系列能量降序、频率降序、波长变长的固有模态,并提取其 前P个固有模态;对所述P个固有模态做Hilbert变换,获得作为时域函数的瞬 时幅值和瞬时频率,从而得到各个固有模态的时间-频率-幅值分布,其记为情感 语音的Hilbert谱。
5.根据权利要求4所述的儿童语音情感识别方法,其特征在于,所述EMD 分解取前6个固有模态,即所述P为6。
6.根据权利要求1所述的儿童语音情感识别方法,其特征在于,
所述音强特征提取方法为:对情感语音的固有模态计算Teager能量算子, 然后取模,提取幅度信息,用来表征音强特征;
所述语调特征提取方法为:对情感语音的固有模态的Hilbert谱计算Teager 能量算子,取模后,根据设定的幅度域值确定出浊音段与清音段,之后对无声 段和清音段进行插值,得到基音曲线全局变化趋势,用来表征语调特征;
所述音色特征提取方法为:从所述浊音段估计声门波导数信号,由牛顿-高 斯型非线性估计方法获得分段函数的Liljencrants-Fant模型表示声门波导数的粗 糙部分,然后从声门波导数估计值中减去次粗糙结构,得到精细结构分量,对 精细分量做HHT变换,提取没有被一般的声门波形状所表现的特征,作为音色 特征;
所述节奏特征提取方法为:对情感语音的固有模态计算语速,用以表征节 奏特征。
7.根据权利要求1所述的的儿童语音情感识别方法,其特征在于,所述情 感识别包括以下步骤:
对待识别的语音信息重复步骤(S10)到(S20),以获得该语音信息的四 元特征,将所述待识别的语音信息的四元特征输入所述SVM/HMM混合系统的 分类器,以获得情感分类。
8.根据权利要求1所述的的儿童语音情感识别方法,其特征在于,所述方 法还包括一语音合成步骤,所述语音合成步骤包括:
根据所述情感特征投影集进行聚类,得出每一种情感的聚类状态模型,所 述聚类状态模型统计了自然情感特征映射到其他不同情感空间中的映射关系, 为一对多映射模型;
对于一待合成的情感语句,获得其情感标签,所述情感标签是预先指定, 或者是通过语义分析方法进行判断获取;
构造所述待合成的情感语句的中性语音,并进行步骤(S10)到(S20)以 获取其四元特征;
通过情感特征投影集对应的聚类状态模型,把自然情感的四元特征映射到 情感标签对应的情感空间中去;
用映射后的四元特征合成情感标签指定的情感语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海盛淘智能科技有限公司,未经上海盛淘智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810148844.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:PDP交互式透明电极结构
- 下一篇:旋转式压缩机