[发明专利]语音识别模型的训练方法、装置、设备及存储介质在审

申请号：	202211243712.7	申请日：	2022-10-11
公开（公告）号：	CN115662393A	公开（公告）日：	2023-01-31
发明（设计）人：	王宁;李良斌	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26;G06Q10/08
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	邢少真
地址：	100094 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别模型训练方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音识别模型的训练方法、装置、设备及存储介质，属于人工智能领域。所述方法包括：获取样本音频集，所述样本音频集中包括多个样本音频；基于初始语音识别模型，在所述样本音频集中筛选候选样本音频；在所述候选样本音频中提取音频片段；其中，所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频；且，所述初始语音识别模型在对所述候选样本音频进行语音识别时，未正确识别所述连续相同文本单元；根据所述音频片段对所述初始语音识别模型进行再训练，得到目标语音识别模型。本申请能够提升语音识别质量，特别是提升了对连续相同文本单元的识别准确度。

技术领域

本申请涉及人工智能领域，特别涉及一种语音识别模型的训练方法、装置、设备及存储介质。

背景技术

语音识别是人工智能发展过程中的一个重要突破。广义上讲，语音识别以语音为研究对象，目标是实现人与机器之间基于自然语言进行交互。狭义上讲，语音识别是一项让机器通过识别和理解过程将语音转换为文本或命令的技术。

目前语音识别技术已经广泛应用在诸如工业、家电、通信、汽车、电子、医疗、家庭服务等领域。其中，在语音识别过程中，语音识别的准确度至关重要，因为语音识别的准确度越高，用户的满意程度便越高。为此，如何准确地进行语音识别，以提升语音识别效果，便成为了本领域的一个研究热点。

发明内容

本申请实施例提供了一种语音识别模型的训练方法、装置、设备及存储介质，能够提升语音识别质量，特别是提升了对连续相同文本单元的识别准确度。所述技术方案如下：

一方面，提供了一种语音识别模型的训练方法，所述方法包括：

获取样本音频集，所述样本音频集中包括多个样本音频；

基于初始语音识别模型，在所述样本音频集中筛选候选样本音频；

在所述候选样本音频中提取音频片段；其中，所述音频片段包括所述候选样本音频中与连续相同文本单元对齐的音频；且，所述初始语音识别模型在对所述候选样本音频进行语音识别时，未正确识别所述连续相同文本单元；

根据所述音频片段对所述初始语音识别模型进行再训练，得到目标语音识别模型。