[发明专利]语音情绪识别方法、装置、设备及存储介质有效
申请号: | 202110408995.5 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113129927B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 顾艳梅;凌波;王少军;马骏 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情绪 识别 方法 装置 设备 存储 介质 | ||
1.一种语音情绪识别方法,其特征在于,所述语音情绪识别方法包括:
获取对话语音信息集,所述对话语音信息集用于指示用户与目标客服之间的通话语音信息,所述目标客服包括机器人客服和人工客服;
对所述对话语音信息集进行语音数据预处理,得到已处理语音信息集,并对所述已处理语音信息集进行情绪类型划分,得到语音训练样本集;
基于所述语音训练样本集对预设的双向长短期记忆网络模型进行迭代剪枝处理和模型训练,得到目标情绪识别模型;
将所述目标情绪识别模型移植至移动终端,并通过所述移动终端中的目标情绪识别模型对实时采集的用户语音信息进行情绪识别处理,得到目标情绪类别,以使得所述移动终端显示所述目标情绪类别对应的文字信息和/或图案信息;
所述基于所述语音训练样本集对预设的双向长短期记忆网络模型进行迭代剪枝处理和模型训练,得到目标情绪识别模型,包括:
按照预设比例对所述语音训练样本集进行划分,得到语音训练集和语音测试集;
通过预设的权重剪枝算法,在神经网络框架中对预设的双向长短期记忆网络模型进行剪枝处理和量化处理,得到剪枝后的双向长短期记忆网络模型;
基于所述语音训练集和所述语音测试集,按照预设的训练次数对所述剪枝后的双向长短期记忆网络模型进行模型训练和模型测试,得到已训练的情绪识别模型;
当所述已训练的情绪识别模型满足预设的迭代终止条件时,确定所述已训练的情绪识别模型为目标情绪识别模型,并将所述目标情绪识别模型保存为第一模型文件,所述预设的迭代终止条件为已剪枝次数等于预设次数和/或已训练的情绪识别模型的精度小于预设精度阈值,所述第一模型文件为标准模型格式的文件;
所述将所述目标情绪识别模型移植至移动终端,并通过所述移动终端中的目标情绪识别模型对实时采集的用户语音信息进行情绪识别处理,得到目标情绪类别,以使得所述移动终端显示所述目标情绪类别对应的文字信息和/或图案信息,包括:
将所述第一模型文件转换为第二模型文件,在移动终端中安装机器学习框架的依赖包,并执行所述第二模型文件,得到执行结果,所述第二模型文件为迁移模型格式的文件;
当所述执行结果为执行成功时,确定所述目标情绪识别模型已成功移植至所述移动终端中;
通过所述移动终端中的目标情绪识别模型对实时采集的用户语音信息进行情绪识别处理,得到目标情绪类别,根据所述目标情绪类别确定对应的文字信息或图案信息,以使得所述移动终端显示所述目标情绪类别对应的文字信息或图案信息。
2.根据权利要求1所述的语音情绪识别方法,其特征在于,所述对所述对话语音信息集进行语音数据预处理,得到已处理语音信息集,并对所述已处理语音信息集进行情绪类型划分,得到语音训练样本集,包括:
对所述对话语音信息集依次进行降噪处理、语音增强处理和语音片段截取,得到初始语音信息集;
通过所述预设的音频特征提取工具分别对所述初始语音信息集提取对应的梅尔频谱情绪特征,并将各初始语音信息对应的梅尔频谱情绪特征保存为逗号分隔值格式文件,得到已处理语音信息集;
通过预设的语音情绪分类模型分别对所述已处理语音信息集进行情绪识别,得到各已处理语音信息对应的情绪类型;
根据各已处理语音信息对应的情绪类型对各已处理语音信息设置对应的分类标签,并按照各已处理语音信息对应的分类标签将所述已处理语音信息集分类存储至预设的文件目录中,得到语音训练样本集。
3.根据权利要求1所述的语音情绪识别方法,其特征在于,所述通过所述移动终端中的目标情绪识别模型对实时采集的用户语音信息进行情绪识别处理,得到目标情绪类别,根据所述目标情绪类别确定对应的文字信息或图案信息,以使得所述移动终端显示所述目标情绪类别对应的文字信息或图案信息,包括:
在所述移动终端中对实时采集的用户语音信息进行特征提取,得到语音情绪特征信息,通过所述移动终端中的目标情绪识别模型对所述语音情绪特征信息进行分类处理,得到目标情绪类别;
将所述目标情绪类别设置为目标键,按照所述目标键查询预设的内存数据库,得到所述目标情绪类别对应的文字信息或图案信息;
调用预设的实时数据推送接口将所述目标情绪类别对应的文字信息或图案信息发送至所述移动终端,以使得所述移动终端显示所述目标情绪类别对应的文字信息或图案信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110408995.5/1.html,转载请声明来源钻瓜专利网。