[发明专利]一种语音识别方法及装置在审
申请号: | 201910867294.0 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110675864A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 闫博群;汪俊;李索恒;张志齐;郑达 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 柴燕梅 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 子模型 语音训练数据 语音识别系统 语音增强 训练数据集合 语音处理技术 背景噪声 迭代过程 迭代训练 训练结果 训练数据 在线生成 精准度 并行 更新 | ||
1.一种语音识别方法,其特征在于,所述方法应用于语音识别系统,所述语音识别系统至少包括语音识别模型,所述语音识别模型包括多个语音识别子模型,各语音识别子模型具有相同的模型结构,所述方法包括:
针对每次迭代训练过程中的每个语音识别子模型,执行如下操作直至训练结束:
所述语音识别子模型并行地从训练数据集合中获取第一语音训练数据,所述第一语音训练数据是从所述训练数据集中确定的,不同的语音识别子模型获取的第一语音训练数据不同;
所述语音识别子模型根据获取语音增强参数及第一语音训练数据确定第二语音训练数据,所述语音增强参数用于为第一语音训练数据增加背景噪声;
所述语音识别子模型使用所述第二语音训练数据进行训练,并根据本次迭代过程中其他语音识别子模型的训练结果更新所述语音识别子模型;所述其他语音识别子模型为各语音识别子模型中的任一个或多个。
2.根据权利要求1所述的方法,其特征在于,所述语音识别子模型并行地从训练数据集合中获取第一语音训练数据,包括:
所述语音识别子模型在开始进行训练时,并行地从所述训练数据集合中的一个训练批次集合中获取所述第一语音训练数据;所述一个训练批次集合中的语音训练数据的数量与各语音识别子模型的数量相同且所述一个训练批次集合中的各语音训练数据的音频长度的差值在预设范围之内。
3.根据权利要求2所述的方法,其特征在于,通过如下方式确定一个训练批次集合中的各语音训练数据,包括:
获取到所述训练数据集合中所有的语音训练数据后,按照各语音训练数据的音频长度进行排序;
按照所有语音识别子模型的数量,从排序后的各语音训练数据中依次划分各训练批次集合。
4.根据权利要求1至3任一项所述的方法,其特征在于,每个语音识别子模型训练结束后,还包括:
各语音识别子模型获取各自的待识别子音频,所述待识别子音频是将待识别音频按照各语音识别子模型的数量划分得到的,各语音识别子模型在训练结束后具有相同的模型结构以及相同的模型参数;
各语音识别子模型将所述待识别子音频转换为文本信息并输出所述文本信息。
5.一种语言识别装置,其特征在于,所述装置应用于语音识别子模型中,所述语言识别子模型适用于语音识别系统,所述语音识别系统至少包括语音识别模型,所述语音识别模型包括多个语音识别子模型,各语音识别子模型具有相同的模型结构,所述装置包括:
针对每次迭代训练过程中的每个语音识别子模型,执行如下操作直至训练结束:
获取单元,用于并行地从训练数据集合中获取第一语音训练数据,所述第一语音训练数据是从所述训练数据集中确定的,不同的语音识别子模型获取的第一语音训练数据不同;
确定单元,用于根据获取语音增强参数及第一语音训练数据确定第二语音训练数据,所述语音增强参数用于为第一语音训练数据增加背景噪声;
训练单元,用于使用所述第二语音训练数据进行训练,并根据本次迭代过程中其他语音识别子模型的训练结果更新所述语音识别子模型;所述其他语音识别子模型为各语音识别子模型中的任一个或多个。
6.根据权利要求5所述的装置,其特征在于,所述获取单元具体用于:
在开始进行训练时,并行地从所述训练数据集合中的一个训练批次集合中获取所述第一语音训练数据;所述一个训练批次集合中的语音训练数据的数量与各语音识别子模型的数量相同且所述一个训练批次集合中的各语音训练数据的音频长度的差值在预设范围之内。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
训练数据生成单元,用于获取到所述训练数据集合中所有的语音训练数据后,按照各语音训练数据的音频长度进行排序;按照所有语音识别子模型的数量,从排序后的各语音训练数据中依次划分各训练批次集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910867294.0/1.html,转载请声明来源钻瓜专利网。