[发明专利]一种语音情感识别方法、装置、电子设备及存储介质在审
申请号: | 202211236607.0 | 申请日: | 2022-10-10 |
公开(公告)号: | CN115497510A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 王苏振;丁彧;吕唐杰;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/02;G10L15/06;G10L15/26 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 情感 识别 方法 装置 电子设备 存储 介质 | ||
本申请涉及语音处理技术领域,尤其涉及一种语音情感识别方法、装置、电子设备及存储介质。本申请通过将获取的待识别的目标语音和目标语音对应的目标文本一同输入训练好的语音情感计算模型中,可以得到目标语音对应的主情感、伴随情感以及情感强度;其中,语音情感计算模型是利用多个样本语音,以及每个样本语音对应的样本主情感标签、样本伴随情感标签和样本情感强度标签进行训练得到的。这样,可以从目标语音中识别出包含主情感和伴随情感的细粒度情感以及情感强度,可以提升情感识别效果。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种语音情感识别方法、装置、电子设备及存储介质。
背景技术
语音情感识别是一种从用户语音中识别用户情感状态的技术,用来感知、传递人与人之间、人与机器之间的情感,在人机交互、健康监控、虚拟现实等领域有着迫切的应用需求,是人工智能领域的一个重要分支。
目前,已经有一些技术用于语音情感计算,但实际情况中,语音的情感表达是非常复杂的,尤其是影视、动漫、游戏等语音,即使一句话中,也往往蕴含着多种情感的转换。基于目前主流的语音情感数据标注方案和语音情感计算技术,往往忽略了一段话中的情感变化,导致这种方式标注的数据只能处理粗粒度情感,很难应用到较为细腻的情感感知场景中,因此,不能取得很好的情感识别效果。
发明内容
有鉴于此,本申请实施例至少提供一种语音情感识别方法、装置、电子设备及存储介质,可以从目标语音中识别出包含主情感和伴随情感的细粒度情感以及情感强度,可以提升情感识别效果。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供一种语音情感识别方法,所述语音情感识别方法包括:获取待识别的目标语音,并确定所述目标语音对应的目标文本;将所述目标语音和所述目标文本一同输入训练好的语音情感计算模型中,得到所述目标语音对应的主情感、伴随情感以及情感强度;其中,所述语音情感计算模型是利用多个样本语音,以及每个样本语音对应的样本主情感标签、样本伴随情感标签和样本情感强度标签进行训练得到的。
在一种可能的实施方式中,针对任一所述样本语音,根据以下步骤生成所述样本语音对应的样本主情感标签、样本伴随情感标签和样本情感强度标签:对所述样本语音进行识别,得到所述样本语音对应的样本文本和各个子语音句子的时间戳;基于所述样本语音对应的样本文本、以及各个子语音句子对应的时间戳,生成可视化的初始标注信息文件;基于所述样本语音、预先定义好的主情感集、伴随情感集以及预设标注规则,对所述初始标注信息文件进行标注,生成所述样本语音对应的样本主情感标签、样本伴随情感标签和样本情感强度标签。
第二方面,本申请实施例还提供一种语音情感识别装置,所述语音情感识别装置包括:获取模块,用于获取待识别的目标语音,并确定所述目标语音对应的目标文本;输入模块,用于将所述目标语音和所述目标文本一同输入训练好的语音情感计算模型中,得到所述目标语音对应的主情感、伴随情感以及情感强度;其中,所述语音情感计算模型是利用多个样本语音,以及每个样本语音对应的样本主情感标签、样本伴随情感标签和样本情感强度标签进行训练得到的。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的语音情感识别方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的语音情感识别方法的步骤。
第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述第一方面或第一方面中任一种可能的实施方式中所述的语音情感识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211236607.0/2.html,转载请声明来源钻瓜专利网。