[发明专利]一种基于半监督特征选择的语音情感识别方法有效

申请号：	201410216935.3	申请日：	2014-05-21
公开（公告）号：	CN104008754B	公开（公告）日：	2017-01-18
发明（设计）人：	文贵华;孙亚新	申请（专利权）人：	华南理工大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L17/14;G10L17/02;G10L17/04
代理公司：	广州市华学知识产权代理有限公司44245	代理人：	蔡茂略
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于半监督特征选择的语音情感识别方法，该方法针对每个说话人训练一个特定的分类器，可以很好的减小由于说话人之间的不同对语音情感识别造成的负面影响。训练步骤如下提取有标签样本和某一说话人的无标签样本的特征，使用多个统计函数获得所有特征的统计结果，再执行归一化算法；然后使用半监督特征选择算法选择能够突出该测试说话人语音情感的特征，该半监督特征选择算法能够同时考虑数据的流形结构，数据的类别结构，以及利用该测试说话人的无标签数据所提供的信息；最后使用支持向量机训练该测试说话人的语音情感识别的分类器。本发明在用于说话人归一化算法的样本数量较少时也能获得较高的识别精度。
搜索关键词：	一种基于监督特征选择语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于半监督特征选择的语音情感识别方法，其特征在于，包括步骤：(1)训练阶段：(1‑1)提取所有有标签样本的语音信号特征以及某一待识别情感说话人的无标签样本的语音信号特征；提取语音信号特征包括：MFCC、LFPC、LPCC、ZCPA、PLP、R‑PLP，每类特征的特征提取结果均为二维矩阵，其中一个维度为时间维度；然后计算每类特征Fi在时间维度上的一阶导数ΔFi、二阶导数ΔΔFi，并将原始特征、一阶导数结果、二阶导数结果在非时间维度上串接，形成每一类特征的最终特征提取结果；将上述所有类的特征的最终特征提取结果在非时间维度上串接即为该样本的特征提取结果；(1‑2)对所有特征执行特征统计；(1‑3)对所有的特征统计结果执行归一化算法；(1‑4)使用半监督特征选择算法突出该待识别情感说话人语音情感变化的特征，得到特征选择向量；(1‑5)使用特征选择结果训练针对该待识别情感说话人的语音情感分类器；(1‑6)所有需识别情感的说话人均按照上述步骤(1‑1)—(1‑5)得到对应的分类器；(2)识别阶段：提取待识别样本的语音信号特征，对特征进行特征统计，对特征统计结果执行归一化算法，然后根据步骤(1‑4)得到的特征选择向量计算特征选择结果，然后将特征选择结果代入步骤(1‑6)得到的该说话人对应的分类器，即获得待识别样本的情感类别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410216935.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于半监督特征选择的语音情感识别方法有效

专利文献下载