[发明专利]语音识别模型训练方法、语音识别方法及相关装置在审
申请号: | 202010858518.4 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112017643A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 唐浩雨 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 511402 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 相关 装置 | ||
1.一种语音识别模型训练方法,其特征在于,包括:
获取训练语音以及所述训练语音的语音文本;
合并预设字典和预设词典生成混合词典;
采用所述预设字典对所述语音文本进行字编码得到字训练数据;
根据所述混合词典对所述语音文本进行语义分词编码和随机分词编码得到词义分词训练数据和随机分词训练数据;
依次采用所述字训练数据、所述词义分词训练数据和所述随机分词训练数据训练语音识别模型。
2.根据权利要求1所述的方法,其特征在于,所述合并预设字典和预设词典生成混合词典,包括:
合并所述预设字典和所述预设词典得到初始混合词典;
对所述初始混合词典进行去重处理得到最终的混合词典。
3.根据权利要求2所述的方法,其特征在于,所述预设字典和所述预设词典包括字和字的编码值,所述对所述初始混合词典进行去重处理得到最终的混合词典,包括:
在所述初始混合词典中查找重复的字;
从所述初始混合词典中删除来源于所述预设字典中所述重复的字和编码值,或者删除来源于所述预设词典中所述重复的字和编码值,得到最终的混合词典。
4.根据权利要求1所述的方法,其特征在于,所述预设字典包括字和字的编码值,所述采用所述预设字典对所述语音文本进行字编码得到字训练数据,包括:
从所述预设字典中查找所述语音文本中每个字的编码值;
按照每个字在所述语音文本中的顺序和每个字的所述编码值生成所述语音文本的第一编码序列;
将所述训练语音和所述第一编码序列作为字训练数据,其中,所述训练语音作为训练样本,所述第一编码序列作为样本标签。
5.根据权利要求1所述的方法,其特征在于,所述根据所述混合词典对所述语音文本进行语义分词编码和随机分词编码得到词义分词训练数据和随机分词训练数据,包括:
按照所述语音文本的语义信息对所述语音文本进行分词得到第一分词序列,以及对所述语音文本进行随机分词处理得到第二分词序列;
从所述混合词典中查找所述第一分词序列中每个分词的编码值,以及从所述混合词典中查找所述第二分词序列中每个分词的编码值;
按照所述第一分词序列中每个分词的编码值生成所述语音文本的第二编码序列,以及按照所述第二分词序列中每个分词的编码值生成所述语音文本的第三编码序列;
将所述训练语音和所述第二编码序列作为词义分词训练数据,以及将所述训练语音和所述第三编码序列作为随机分词训练数据,其中,所述训练语音作为所述词义分词训练数据和所述随机分词训练数据的训练样本,所述第二编码序列作为所述词义分词训练数据的样本标签,所述第三编码序列作为所述随机分词训练数据的样本标签。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述依次采用所述字训练数据、所述词义分词训练数据和所述随机分词训练数据训练语音识别模型,包括:
初始化语音识别模型;
采用所述字训练数据来对所述初始化后的语音识别模型进行字训练得到第一语音识别模型;
采用所述词义分词训练数据和所述随机分词训练数据来对所述第一语音识别模型进行词训练得到训练好的语音识别模型。
7.根据权利要求6所述的方法,其特征在于,所述初始化语音识别模型,包括:
构建输出层长度等于所述混合词典的长度的语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010858518.4/1.html,转载请声明来源钻瓜专利网。