[发明专利]语音情感识别模型的确定方法、装置、设备及存储介质有效
申请号: | 202010079139.5 | 申请日: | 2020-02-03 |
公开(公告)号: | CN111210844B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 韩文静;李岩;姜涛 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/06 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 模型 确定 方法 装置 设备 存储 介质 | ||
1.一种语音情感识别模型的确定方法,其特征在于,包括:
获取语音样本;
将所述语音样本输入待训练的语音情感识别模型,通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本进行分类,得到输出结果,其中,所述输出层中预设的K-1个输出节点为按照指定顺序排列的输出节点,K为大于2的正整数,所述语音样本为标记有K-1个二值标签的向量,所述获取语音样本包括多个语音片段,所述二值标签的向量为通过各个所述语音片段的情感属性预测分值判断得到的向量;
基于预设损失函数根据所述输出结果,确定所述待训练的语音情感识别模型的损失;
当所述待训练的语音情感识别模型的损失不满足预设条件时,根据所述损失对所述待训练的语音情感识别模型的参数进行调整,直至当所述待训练的语音情感识别模型的损失满足预设条件时,得到训练好的语音情感识别模型;
所述基于预设损失函数根据所述输出结果,通过确定所述待训练的语音情感识别模型的损失,包括:
根据所述输出结果,通过预设损失函数:
确定所述待训练的语音情感识别模型的损失,
其中,L(W,b)为预设损失函数计算得到的损失;λk为依据训练数据的均衡程度设定的值;xi为语音片段的语音向量;s()为激活函数的映射;表示yi的数值与rk的大小关系,(1≤k≤K),即为语音片段的情感属性分值,符号<代表了情感属性值内在的相对顺序,r1代表最低分值,rK代表最高分值;W为不包含输出层权值的权值矩阵,则g(xi,W)为倒数第二层的输出;表示第k个输出节点的输出,表示,当为输出层的各输出节点的输入,经s()映射得到的第k个输出节点的输出。
2.根据权利要求1所述的方法,其特征在于,所述二值标签的向量的获取方法,包括:
获取第i个语音样本xi的第i语音片段{xi,yi}的情感属性预测分值yi,通过预设函数:
得到所述语音样本对应的二值标签向量rk为预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待识别语音信息,通过所述训练好的语音情感识别模型对所述待识别语音信息进行识别,得到所述待识别语音信息的情感种类。
4.根据权利要求1所述的方法,其特征在于,所述将所述语音样本输入待训练的语音情感识别模型,通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本进行分类,得到输出结果,包括:
将所述语音样本输入待训练的语音情感识别模型,利用所述待训练的语音情感识别模型,提取所述语音片段的语音向量;
通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本的语音向量进行映射,得到输出结果。
5.根据权利要求1所述的方法,其特征在于,所述对所述语音样本的语音向量进行映射,得到输出结果,
其中,对所述语音样本xi的语音向量进行映射,输出层第k个输出节点的输出为fk(xi):
h(xi)为第i个语音样本xi的情感属性分值,rq∈{r1,r2,…,rK},(r1<…rK-1<rK∈Z),q∈[1,K]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010079139.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离心式多次雾化分离装置
- 下一篇:壳体加工方法、壳体及电子设备