[发明专利]模型的训练方法、语音识别方法、装置、介质及设备有效
申请号: | 202011554089.8 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112669816B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 王康 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/06 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 语音 识别 装置 介质 设备 | ||
1.一种语音识别模型的训练方法,其特征在于,所述方法包括:
获取训练数据,其中,所述训练数据中包含至少两个语种的标注数据;
按照每一语种的标注数据的数量由高至低的顺序对各个语种进行排序,以获得各个语种对应的训练顺序;
按照所述训练顺序指示的语种的排位,依次获取每一语种所对应的目标数据对预设模型进行迭代训练,获得目标语音识别模型,其中,所述目标数据是根据所述训练顺序中第一排位至当前排位的语种的标注数据确定出的,所述目标语音识别模型用于对所述至少两个语种的语音数据进行语音识别。
2.根据权利要求1所述的方法,其特征在于,所述按照所述训练顺序指示的语种的排位,依次获取每一语种所对应的目标数据对预设模型进行迭代训练,获得目标语音识别模型,包括:
获取目标语种对应的目标数据,其中,所述目标语种初始为所述训练顺序中第一排位的语种;
根据所述目标语种对应的所述目标数据,对所述目标语种对应的初始模型进行训练,获得所述目标语种对应的目标模型,其中,在所述目标语种为所述第一排位的语种的情况下,所述初始模型为所述预设模型,在所述目标语种不是所述第一排位的语种的情况下,所述初始模型为所述训练顺序中所述目标语种的上一语种对应的目标模型;
将所述训练顺序中所述目标语种的下一语种作为新的目标语种,返回所述获取目标语种对应的目标数据的步骤,直至每一语种的标注数据均进行迭代训练,将所述训练顺序中最后排位的语种对应的目标模型确定为所述目标语音识别模型。
3.根据权利要求2所述的方法,其特征在于,所述获取目标语种对应的目标数据,包括:
在所述目标语种为所述第一排位的语种的情况下,将所述目标语种的标注数据中第一数量的数据作为所述目标数据,其中,所述第一数量大于所述训练顺序中所述目标语种的下一语种的标注数据的数量,且所述第一数量小于或等于所述目标语种的标注数据的数量;
在所述目标语种不是所述第一排位的语种、且不是最后排位的语种的情况下,分别从所述目标语种的标注数据和排位位于所述目标语种之前的每一语种的标注数据中,获取第二数量的数据作为所述目标数据,其中,所述第二数量大于所述目标语种对应的下一语种的标注数据的数量,且所述第二数量小于或等于所述目标语种的标注数据的数量;
在所述目标语种为最后排位的语种的情况下,分别从每一所述语种中获取第三数量的标注数据作为所述目标数据,其中,所述第三数量为所述目标语种的标注数据的数量。
4.根据权利要求1所述的方法,其特征在于,在获取每一语种所对应的目标数据对预设模型进行迭代训练的过程中,每一迭代训练对应的模型学习率与该次迭代训练中新增的语种的标注数据的数量呈正相关关系。
5.根据权利要求4所述的方法,其特征在于,通过以下方式确定每一所述迭代训练对应的模型学习率:
在所述迭代训练为首次迭代的情况下,将预设学习率确定为该次迭代训练对应的模型学习率;
在所述迭代训练不是首次迭代的情况下,将上次迭代训练对应的模型学习率与目标比例的乘积确定为该次迭代训练对应的模型学习率,其中,所述目标比例小于1。
6.根据权利要求5所述的方法,其特征在于,所述目标比例为该次迭代训练新增的语种的标注数据的数量与首次迭代训练的语种的标注数据的数量的比值。
7.一种语音识别方法,其特征在于,所述方法包括:
接收待识别的语音数据;
将所述语音数据输入目标语音识别模型,将所述目标语音识别模型输出的识别结果作为所述语音数据的识别结果,其中,所述目标语音识别模型为根据权利要求1-6中任一项所述方法训练得出的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011554089.8/1.html,转载请声明来源钻瓜专利网。