[发明专利]声纹识别模型训练方法、装置、移动终端及存储介质在审
申请号: | 202010469636.6 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111783939A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 洪国强;肖龙源;李稀敏;刘晓葳;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G10L17/00;G10L17/02;G10L17/04;G10L17/18 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 邱冬新 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 模型 训练 方法 装置 移动 终端 存储 介质 | ||
本发明提供了一种声纹识别模型训练方法、装置、移动终端及存储介质,该方法包括:控制xvector声纹识别模型对训练数据进行特征提取,获得训练特征向量,通过第一全连接层对训练特征向量进行类型识别得到预设特征向量和动态数字特征向量;将预设特征向量和动态数字特征向量分别对应输入第二全连接层和第三全连接层;对第二全连接层和第三全连接层进行损失计算得到第一损失概率和第二损失概率,根据第一损失概率和第二损失概率对第二全连接层和第三全连接层进行训练。本发明通过根据预设特征向量对第二全连接层进行训练,并控制动态数字特征向量对第三全连接层进行训练的设计,提高了模型训练后xvector声纹识别模型对文本半相关的识别效果。
技术领域
本发明属于声纹识别技术领域,尤其涉及一种声纹识别模型训练方法、装置、移动终端及存储介质。
背景技术
每个人的声音都蕴涵着特有的生物特征,声纹识别是指利用说话人的声音来识别说话人的一种技术手段。声纹识别同指纹识别等技术一样具有高度的安全可靠性,可以应用在所有需要做身份识别的场合。如在刑侦、银行、证券、保险等金融领域。与传统的身份识别技术相比,声纹识别的优势在于,声纹提取过程简单,成本低,且具有唯一性,不易伪造和假冒。
现有的声纹识别过程中,xvector模型在声纹识别上有不错的效果,声纹的应用场景一般有文本无关,文本相关(固定口令)及文本半相关(动态数字),但现有的xvector模型使用过程中,针对文本半相关的声纹识别效果差,进而降低了文本半相关声纹识别的准确性。
发明内容
本发明实施例的目的在于提供一种声纹识别模型训练方法、装置、移动终端及存储介质,旨在解决现有的声纹识别模型训练方法音频检测效率低且音频检测精准度差的问题。
本发明实施例是这样实现的,一种声纹识别模型训练方法,所述方法包括:
获取训练数据,并将所述训练数据输入xvector声纹识别模型;其中,所述训练数据包括预设数据和动态数字数据;
基于所述xvector声纹识别模型对所述训练数据进行特征提取,获得训练特征向量,并将所述训练特征向量输入第一全连接层;
通过所述第一全连接层对所述训练特征向量进行类型识别,得到预设特征向量和动态数字特征向量;
将所述预设特征向量和所述动态数字特征向量分别对应输入第二全连接层和第三全连接层,所述第二全连接层和所述第三全连接层均对应一个输出;
使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算,得到第一损失概率和第二损失概率;
根据所述第一损失概率对所述第二全连接层进行训练,并根据所述第二损失概率对所述第三全连接层进行训练,直至所述第二全连接层和所述第三全连接层的输出收敛。
更进一步的,所述基于所述xvector声纹识别模型对所述训练数据进行特征提取的步骤包括:
将所述训练数据输入所述xvector声纹识别模型中的TDNN网络,并控制所述TDNN网络对所述训练数据进行特征提取,得到训练特征;
TDNN网络控制所述TDNN网络对所述训练特征进行非线性变换,得到所述训练特征向量。
更进一步的,所述使用损失计算层对所述第二全连接层和所述第三全连接层的输出分别进行损失计算,得到第一损失概率和第二损失概率的步骤包括:
根据预设损失函数和所述预设特征向量对所述第二全连接层的输出进行损失计算,得到第一损失概率;
根据所述预设损失函数和所述动态数字特征向量对所述第三全连接层的输出进行损失计算,得到第二损失概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010469636.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分拣装置
- 下一篇:基于Kriging模型的涡轮轴可靠性优化设计方法