[发明专利]用于说话人识别的网络模型训练方法、装置及存储介质在审
申请号: | 202111495680.5 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114360552A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王佳;兰天浩;林秋镇;李坚强 | 申请(专利权)人: | 深圳大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/14;G10L15/02;G06K9/62 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王娅洁 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音识别技术领域,具体是涉及用于说话人识别的网络模型训练方法、装置及存储介质。本发明首先将跨域的说话人样本数据集和音素样本数据集分别输入到一个多任务网络模型中,根据说话人分类子网和音素分类子网输出的结果,采用最大均值差异算法计算这两个结果之间的差异损失值,并作为总损失的一部分,通过增加了差异损失值的总损失不断去训练多任务网络模型,最终得到训练之后的模型,而训练之后的说话人子网模型对不同域的音素样本数据集具有较高的泛化能力,即训练之后的模型能够弱化跨域音素样本数据集与说话人样本数据集所具有的差异给网络模型识别说话人准确性所带来的影响。 | ||
搜索关键词: | 用于 说话 识别 网络 模型 训练 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111495680.5/,转载请声明来源钻瓜专利网。