[发明专利]用于说话人识别的网络模型训练方法、装置及存储介质在审

申请号：	202111495680.5	申请日：	2021-12-08
公开（公告）号：	CN114360552A	公开（公告）日：	2022-04-15
发明（设计）人：	王佳;兰天浩;林秋镇;李坚强	申请（专利权）人：	深圳大学
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/02;G10L17/14;G10L15/02;G06K9/62
代理公司：	深圳市君胜知识产权代理事务所(普通合伙) 44268	代理人：	王娅洁
地址：	518060 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及语音识别技术领域，具体是涉及用于说话人识别的网络模型训练方法、装置及存储介质。本发明首先将跨域的说话人样本数据集和音素样本数据集分别输入到一个多任务网络模型中，根据说话人分类子网和音素分类子网输出的结果，采用最大均值差异算法计算这两个结果之间的差异损失值,并作为总损失的一部分，通过增加了差异损失值的总损失不断去训练多任务网络模型，最终得到训练之后的模型，而训练之后的说话人子网模型对不同域的音素样本数据集具有较高的泛化能力，即训练之后的模型能够弱化跨域音素样本数据集与说话人样本数据集所具有的差异给网络模型识别说话人准确性所带来的影响。
搜索关键词：	用于说话识别网络模型训练方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳大学，未经深圳大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202111495680.5/，转载请声明来源钻瓜专利网。

上一篇：一种目标跟踪方法、系统、装置及设备
下一篇：基于云分发的5G配网监测系统和配网监测方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于说话人识别的网络模型训练方法、装置及存储介质在审

专利文献下载