[发明专利]声学模型训练方法、语音识别算法、存储介质及电子设备在审
申请号: | 202210250296.7 | 申请日: | 2022-03-11 |
公开(公告)号: | CN114822516A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 吴才泽;纪亚萍;李俊杰 | 申请(专利权)人: | 深圳矽速科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/02 |
代理公司: | 深圳市诺正鑫泽知识产权代理有限公司 44689 | 代理人: | 林国友 |
地址: | 518000 广东省深圳市宝安区西乡街道永丰*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 模型 训练 方法 语音 识别 算法 存储 介质 电子设备 | ||
1.一种声学模型训练方法,其特征在于,所述声学模型训练方法包括:
获取数据集中的第一音频特征图谱;
获取原始声学模型;
将所述第一实时音频特征图谱按照第一预设时间长度滑窗以获得第二实时音频特征图谱;
分别将所述第一音频特征图谱以及所述第二音频特征图谱按照第二预设时间长度切分后得到多个第一分段小窗以及多个第二分段小窗;
将多个所述第一分段小窗以及多个所述第二分段小窗输入所述原始声学模型进行计算以获取多个第一分段小窗预测结果以及多个第二分段小窗预测结果;
对每一所述第一分段小窗预测结果以及所述第二分段小窗预测结果进行剥离以及拼接后获取整体预测结果;
根据所述整体预测结果以及链式时序分类算法确定有效语音识别声学模型。
2.如权利要求1所述的声学模型训练方法,其特征在于,所述获取数据集中的第一音频特征图谱的步骤包括:
获取多个原始音频数据;
对多个所述原始音频数据进行数据处理以获取包含多个音频特征图谱的数据集。
3.如权利要求1所述的声学模型训练方法,其特征在于,所述将所述第一实时音频特征图谱按照第一预设时间长度滑窗以获得第二实时音频特征图谱的步骤之前还包括:
将所述第一音频特征图谱数据进行随机时间平移以及倒谱均值方差归一化处理;
将第一音频特征图谱更新为处理过的音频特征图谱。
4.如权利要求1所述的声学模型训练方法,其特征在于,所述对每一所述第一分段小窗预测结果以及所述第二分段小窗预测结果进行剥离以及拼接后获取整体预测结果的步骤包括:
将每一所述第一分段小窗预测结果前端以及每一所述第一分段小窗预测结果的后端均去掉第一预设时间长度的一半以获取多个第一实际预测语音小节;
将每一所述第二分段小窗预测结果前端以及每一所述第二分段小窗预测结果的后端均去掉第一预设时间长度的一半以获取多个第二实际预测语音小节;
将每一所述第一实际预测语音小节以及所述第二实际预测语音小节按照时间顺序拼接以获取整体预测结果。
5.如权利要求1所述的声学模型训练方法,其特征在于,所述根据所述整体预测结果以及链式时序分类算法确定有效语音识别声学模型的步骤包括:
将所述整体预测结果输入链式时序分类算法以获取概率值;
当所述概率值处于第一可靠预设范围值时,确认当前训练有效;
将原始声学模型更新为训练后的语音识别声学模型,并将训练后的语音识别声学模型作为有效语音识别声学模型。
6.如权利要求5所述的声学模型训练方法,其特征在于,所述将所述整体预测结果输入链式时序分类算法以获取概率值的步骤之后还包括:
当所述概率值不处于第一可靠预设范围值时,持续进行链式时序分类算法取概率值计算,并依据所述数据集重新对所述原始声学模型进行训练。
7.如权利要求1所述的声学模型训练方法,其特征在于,所述获取原始声学模型之前还包括:
获取非流式识别的声学模型;
将所述非流式识别的声学模型作为原始声学模型。
8.一种语音识别算法,其特征在于,所述语音识别算法包括:
获取第一实时音频特征图谱以及有效语音识别声学模型;
将所述第一实时音频特征图谱按照第一预设时间长度滑窗以获得第二实时音频特征图谱;
分别将所述第一音频特征图谱以及所述第二音频特征图谱按照第二预设时间长度切分后得到多个第一分段小窗以及多个第二分段小窗;
将多个所述第一分段小窗以及多个所述第二分段小窗输入有效语音识别声学模型进行计算以获取多个第一分段小窗预测结果以及多个第二分段小窗预测结果;
对每一所述第一分段小窗预测结果以及所述第二分段小窗预测结果进行剥离以及拼接后获取整体预测结果;
其中,所述有效语音识别声学模型根据如权利要求1-7任一项所述的声学模型训练方法进行确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳矽速科技有限公司,未经深圳矽速科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210250296.7/1.html,转载请声明来源钻瓜专利网。