[发明专利]声纹识别模型训练方法、装置、移动终端及存储介质在审
申请号: | 202010469636.6 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111783939A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 洪国强;肖龙源;李稀敏;刘晓葳;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G10L17/00;G10L17/02;G10L17/04;G10L17/18 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 邱冬新 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 模型 训练 方法 装置 移动 终端 存储 介质 | ||
1.一种声纹识别模型训练方法,其特征在于,所述方法包括:
获取训练数据,并将所述训练数据输入xvector声纹识别模型;其中,所述训练数据包括预设数据和动态数字数据;
基于所述xvector声纹识别模型对所述训练数据进行特征提取,获得训练特征向量,并将所述训练特征向量输入第一全连接层;
通过所述第一全连接层对所述训练特征向量进行类型识别,得到预设特征向量和动态数字特征向量;
将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第三全连接层,所述第二全连接层和所述第三全连接层均对应一个输出;
使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算,得到第一损失概率和第二损失概率;
根据所述第一损失概率对所述第二全连接层进行训练,并根据所述第二损失概率对所述第三全连接层进行训练,直至所述第二全连接层和所述第三全连接层的输出收敛。
2.如权利要求1所述的声纹识别模型训练方法,其特征在于,所述基于所述xvector声纹识别模型对所述训练数据进行特征提取的步骤包括:
将所述训练数据输入所述xvector声纹识别模型中的TDNN网络,并控制所述TDNN网络对所述训练数据进行特征提取,得到训练特征;
控制所述TDNN网络对所述训练特征进行非线性变换,得到所述训练特征向量。
3.如权利要求1所述的声纹识别模型训练方法,其特征在于,所述使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算的步骤包括:
根据预设损失函数和所述预设特征向量对所述第二全连接层的输出进行损失计算,得到第一损失概率;
根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进行损失计算,得到第二损失概率。
4.如权利要求1所述的声纹识别模型训练方法,其特征在于,所述根据所述第一损失概率对所述第二全连接层进行训练,并根据所述第二损失概率对所述第三全连接层进行训练的步骤包括:
根据所述第一损失概率在所述xvector声纹识别模型中进行正向传播,并根据所述第二损失概率在所述xvector声纹识别模型中进行反向传播。
5.如权利要求1所述的声纹识别模型训练方法,其特征在于,所述将所述训练特征向量输入第一全连接层的步骤之前,所述方法还包括:
对每个所述TDNN网络输出的所述训练特征向量进行池化处理,并将池化后的所述训练特征向量输入所述第一全连接层。
6.如权利要求5所述的声纹识别模型训练方法,其特征在于,所述对每个所述TDNN网络输出的所述训练特征向量进行池化处理的步骤包括:
将每个所述TDNN网络输出的所述训练特征向量进行累计,根据向量累计结果计算所有所述训练特征向量中的均值和标准差,并将所述均值和所述标准差作为所述训练特征向量池化处理后的输出。
7.如权利要求1所述的声纹识别模型训练方法,其特征在于,所述方法还包括:
获取待识别声纹数据,并将所述待识别声纹数据输入所述xvector声纹识别模型;
控制所述xvector声纹识别模型对所述待识别声纹数据进行识别,并将所述第一全连接层的输出结果作为所述xvector声纹识别模型的输出向量;
根据欧式距离公式计算所述输出向量与本地预存储的样本向量之间的匹配值,并获取所述匹配值中最大值对应的所述样本向量的编号值;
当判断到所述编号值大于编号阈值时,判定所述待识别声纹数据的声纹识别合格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010469636.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分拣装置
- 下一篇:基于Kriging模型的涡轮轴可靠性优化设计方法