[发明专利]语音情感识别模型的确定方法、装置、设备及存储介质有效

申请号：	202010079139.5	申请日：	2020-02-03
公开（公告）号：	CN111210844B	公开（公告）日：	2023-03-24
发明（设计）人：	韩文静;李岩;姜涛	申请（专利权）人：	北京达佳互联信息技术有限公司
主分类号：	G10L25/63	分类号：	G10L25/63;G10L15/06
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	丁芸;马敬
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音情感识别模型确定方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音情感识别模型的确定方法，其特征在于，包括：

获取语音样本；

将所述语音样本输入待训练的语音情感识别模型，通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本进行分类，得到输出结果，其中，所述输出层中预设的K-1个输出节点为按照指定顺序排列的输出节点，K为大于2的正整数，所述语音样本为标记有K-1个二值标签的向量，所述获取语音样本包括多个语音片段，所述二值标签的向量为通过各个所述语音片段的情感属性预测分值判断得到的向量；

基于预设损失函数根据所述输出结果，确定所述待训练的语音情感识别模型的损失；

当所述待训练的语音情感识别模型的损失不满足预设条件时，根据所述损失对所述待训练的语音情感识别模型的参数进行调整，直至当所述待训练的语音情感识别模型的损失满足预设条件时，得到训练好的语音情感识别模型；

所述基于预设损失函数根据所述输出结果，通过确定所述待训练的语音情感识别模型的损失，包括：

根据所述输出结果，通过预设损失函数：

确定所述待训练的语音情感识别模型的损失，

其中，L(W,b)为预设损失函数计算得到的损失；λ^k为依据训练数据的均衡程度设定的值；x_i为语音片段的语音向量；s()为激活函数的映射；表示y_i的数值与r_k的大小关系,(1≤k≤K)，即为语音片段的情感属性分值，符号＜代表了情感属性值内在的相对顺序，r₁代表最低分值，r_K代表最高分值；W为不包含输出层权值的权值矩阵，则g(x_i,W)为倒数第二层的输出；表示第k个输出节点的输出，表示，当为输出层的各输出节点的输入，经s()映射得到的第k个输出节点的输出。

2.根据权利要求1所述的方法，其特征在于，所述二值标签的向量的获取方法，包括：

获取第i个语音样本x_i的第i语音片段{x_i,y_i}的情感属性预测分值y_i，通过预设函数：

得到所述语音样本对应的二值标签向量r_k为预设阈值。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取待识别语音信息，通过所述训练好的语音情感识别模型对所述待识别语音信息进行识别，得到所述待识别语音信息的情感种类。

4.根据权利要求1所述的方法，其特征在于，所述将所述语音样本输入待训练的语音情感识别模型，通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本进行分类，得到输出结果，包括：

将所述语音样本输入待训练的语音情感识别模型，利用所述待训练的语音情感识别模型，提取所述语音片段的语音向量；

通过所述待训练的语音情感识别模型的输出层中预设的K-1个输出节点对所述语音样本的语音向量进行映射，得到输出结果。

5.根据权利要求1所述的方法，其特征在于，所述对所述语音样本的语音向量进行映射，得到输出结果，

其中，对所述语音样本x_i的语音向量进行映射，输出层第k个输出节点的输出为f_k(x_i)：

h(x_i)为第i个语音样本x_i的情感属性分值，r_q∈{r₁,r₂,…,r_K},(r₁＜…r_K-1＜r_K∈Z)，q∈[1,K]。