[发明专利]语音情绪识别模型训练方法及电子设备在审
申请号: | 202111010138.6 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113593532A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 简仁贤;许曜麒;林长洲 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/63 |
代理公司: | 上海湾谷知识产权代理事务所(普通合伙) 31289 | 代理人: | 倪继祖 |
地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情绪 识别 模型 训练 方法 电子设备 | ||
1.一种语音情绪识别模型训练方法,其特征在于,包括:
获取语者识别语料;
从所述语者识别语料中提取频域特征数据;
使用所述频域特征数据进行训练,获得语音情绪特征抽取器;
获取语音情绪语料;
利用所述语音情绪特征抽取器从所述语音情绪语料中提取语音情绪特征数据;
使用语音情绪特征数据进行训练,获得语音情绪识别模型。
2.根据权利要求1所述的语音情绪识别模型训练方法,其特征在于,所述从所述语者识别语料中提取频域特征数据,包括:
将所述语者识别语料的语音经过傅里叶变换,获得第一变换结果;
将所述第一变换结果通过梅尔滤波器产生第一梅尔频率倒谱系数特征,作为频域特征数据。
3.根据权利要求1所述的语音情绪识别模型训练方法,其特征在于,所述使用所述频域特征数据进行训练,获得语音情绪特征抽取器,包括:
依次完成多次迭代过程,每次迭代过程包括:
随机选择一部分所述频域特征数据作为当前语者模型输入;
使用当前语者模型输入对当前语者识别模型进行训练,并通过前向传播算法获取语音情绪特征值;
将语音情绪特征值和语音情绪特征真实值的差距记为第一最小化交叉熵;
根据第一最小化交叉熵判断当前语者识别模型是否满足收敛条件,若满足,将当前语者识别模型作为最终语者识别模型;若不满足,迭代次数加1,以所述语音情绪特征值逐步靠近语音情绪特征真实值为目标,通过反向传播算法更新当前语者识别模型的参数,进行一下个迭代过程;
将最终语者识别模型作为语音情绪特征抽取器。
4.根据权利要求1所述的语音情绪识别模型训练方法,其特征在于,所述利用所述语音情绪特征抽取器从所述语音情绪语料中提取语音情绪特征数据,包括:
将所述语音情绪语料的语音经过傅里叶变换,获得第二变换结果;
将所述第二变换结果通过梅尔滤波器产生第二梅尔频率倒谱系数特征;
将第二梅尔频率倒谱系数特征输入语音情绪特征抽取器,获得语音情绪特征数据。
5.根据权利要求1所述的语音情绪识别模型训练方法,其特征在于,所述使用语音情绪特征数据进行训练,获得语音情绪识别模型,包括:
依次完成多次迭代过程,每次迭代过程包括:
随机选择一部分所述语音情绪特征数据作为当前情绪模型输入;
使用当前情绪模型输入对当前情绪识别模型进行训练,并通过前向传播算法获取语音情绪类别值;
将语音情绪类别值和语音情绪类别真实值的差距记为第二最小化交叉熵;
根据第二最小化交叉熵判断当前情绪识别模型是否满足收敛条件,若满足,将当前情绪识别模型作为最终情绪识别模型;若不满足,迭代次数加1,以所述语音情绪类别值逐步靠近语音情绪类别真实值为目标,通过反向传播算法更新当前情绪识别模型的参数,进行一下个迭代过程;
将最终情绪识别模型作为语音情绪识别模型。
6.根据权利要求3所述的语音情绪识别模型训练方法,其特征在于,
所述当前语者识别模型采用ECAPA-TDNN;
所述语音情绪特征真实值通过所述语者识别语料获取。
7.根据权利要求5所述的语音情绪识别模型训练方法,其特征在于,
所述当前情绪识别模型采用多层感知器;
所述语音情绪类别真实值通过所述语音情绪语料获取。
8.根据权利要求4所述的语音情绪识别模型训练方法,其特征在于,将所述第二梅尔频率倒谱系数特征输入语音情绪特征抽取器,语音情绪特征抽取器的倒数第二层生成向量值,提取该向量值作为语音情绪特征数据。
9.根据权利要求3或5所述的语音情绪识别模型训练方法,其特征在于,所述收敛条件为:满足条件一或条件二,
条件一:第一最小化交叉熵或第二最小化交叉熵停止变化;
条件二:迭代次数达到200次。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-8任意一项所述语音情绪识别模型训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111010138.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种压紧装置及弯曲机
- 下一篇:基于区块链技术的网络安全漏洞响应方法