[发明专利]语音情绪识别系统在审
申请号: | 201711362343.2 | 申请日: | 2017-12-18 |
公开(公告)号: | CN109961803A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 余世经;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/24;G10L25/51;G10L15/06;H04M3/51 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频特征向量 情绪识别 情绪特征 情绪 语音片段 配置 语音 音片 分类 匹配 音频特征提取模块 呼叫中心系统 分类标签 建立模块 判定模块 匹配结果 匹配模块 情绪模型 情绪状态 实时监测 音频流 客服 预设 客户 学习 | ||
1.一种语音情绪识别系统,其特征在于,包括:
音频特征提取模块,配置为提取待识别音频流中的语音片段的音频特征向量,其中所述语音片段对应所述待识别音频流中的一段话;
匹配模块,配置为将所述语音片段的音频特征向量与多个情绪特征模型进行匹配,其中所述多个情绪特征模型分别对应多个情绪分类之一;以及
情绪判定模块,配置为将匹配结果为相匹配的所述情绪特征模型所对应的情绪分类作为所述语音片段的情绪分类;
情绪模型建立模块,配置为通过对包括所述多个情绪分类对应的情绪分类标签的多个预设语音片段各自的音频特征向量进行预学习来建立所述多个情绪特征模型;
其中,所述音频特征向量包括以下几种音频特征中的一种或多种:能量特征、发音帧数特征、基音频率特征、共振峰特征、谐波噪声比特征以及梅尔倒谱系数特征;所述语音片段对应所述待识别音频流中的一次用户输入语音段,所述多个情绪分类包括:满意分类、平静分类、烦躁分类以及生气分类。
2.根据权利要求1所述的语音情绪识别系统,其特征在于,所述情绪模型建立模块包括:
聚类单元,配置为将包括所述多个情绪分类对应的情绪分类标签的多个预设语音片段各自的音频特征向量进行聚类处理,得到预设情绪分类的聚类结果;以及
训练单元,配置为根据所述聚类结果,将每个聚类中的所述预设语音片段的音频特征向量训练为一个所述情绪特征模型。
3.根据权利要求1所述的语音情绪识别系统,其特征在于,当所述情绪特征模型为混合高斯模型时,则所述匹配模块进一步配置为,计算所述语音片段的音频特征向量分别与所述多个情绪特征模型之间的似然概率;
其中,所述情绪判定模块进一步配置为:将似然概率大于预设阈值且最大的所述情绪特征模型所对应的情绪分类作为所述语音片段的情绪分类。
4.根据权利要求1所述的语音情绪识别系统,其特征在于,进一步包括:
语音片段提取模块,配置为提取待识别音频流中的所述语音片段;其中,所述语音片段提取模块包括:
语句端点检测单元,配置为确定所述待识别音频流中的语音开始帧以及语音结束帧;以及
提取单元,配置为提取所述语音开始帧与所述语音结束帧之间的音频流部分作为所述语音片段。
5.根据权利要求4所述的语音情绪识别系统,其特征在于,所述语句端点检测单元包括:
第一判断子单元,配置为判断所述待识别音频流中的语音帧是发音帧还是非发音帧;
语音开始帧判定子单元,配置为在上一段语音片段的所述语音结束帧之后或者当前未识别到第一段语音片段时,当有第一预设数量个语音帧被连续判断为发音帧时,将所述第一预设数量个语音帧中的第一个语音帧作为当前语音片段的所述语音开始帧;以及
语音结束帧判定子单元,配置为在当前语音片段的所述语音开始帧之后,当有第二预设数量个语音帧被连续判断为非发音帧时,将所述第二预设数量个语音帧中的第一个语音帧作为当前语音片段的所述语音结束帧。
6.根据权利要求1所述的语音情绪识别系统,其特征在于,所述能量特征包括:短时能量一阶差分,和/或预设频率以下的能量大小;和/或,
所述基音频率特征包括:基音频率和/或基音频率一阶差分;和/或,
所述共振峰特征包括以下几项中的一种或多种:第一共振峰、第二共振峰、第三共振峰、第一共振峰一阶差分、第二共振峰一阶差分以及第三共振峰一阶差分;和/或,
所述梅尔倒谱系数特征包括1-12阶梅尔倒谱系数和/或1-12阶梅尔倒谱系数一阶差分。
7.根据权利要求1或6所述的语音情绪识别系统,其特征在于,所述音频特征通过以下计算表征方式中的一种或多种来表征:比例值、均值、最大值、中值以及标准差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711362343.2/1.html,转载请声明来源钻瓜专利网。