[发明专利]生成语音模型和语音识别的方法、装置、设备以及介质有效
申请号: | 202010165847.0 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111354345B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 蔡猛;梁镇麟 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 语音 模型 识别 方法 装置 设备 以及 介质 | ||
本公开的实施例公开了生成语音模型和语音识别的方法、装置、设备以及介质。该方法的一具体实施方式包括:获取训练样本集,其中,训练样本集中的训练样本包括语音样本和语音样本对应的识别结果样本;根据训练样本集,对初始模型进行联合学习训练,得到语音模型,其中,初始模型包括多层输出层。本公开实施例的技术方案实现了训练过程的简化和语音模型的识别准确率的提高。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及生成语音模型和语音识别的方法、装置、设备以及介质。
背景技术
随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生。其中,语音数据受到了人们越来越多的重视。
通常,语音模型的识别准确率和语音模型在训练过程中的样本数量息息相关,减少样本数量或简化训练过程往往会使语音识别的准确率下降。因此,语音模型在训练过程中需要较多的样本且训练过程较为繁琐,语音模型的识别准确率也难以提高。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了用于生成语音模型和语音识别的方法、装置、设备以及介质,来解决以上背景技术部分提到的技术问题。
第一方面,本公开的一些实施例提供了一种用于生成语音模型的方法,该方法包括:获取训练样本集,其中,训练样本集中的训练样本包括语音样本和语音样本对应的识别结果样本;根据训练样本集,对初始模型进行联合学习训练,得到语音模型,其中,初始模型包括多层输出层。
第二方面,本公开的一些实施例提供了一种语音识别的方法,该方法包括:获取目标语音;将所述目标语音输入至预先训练的语音模型,得到所述目标语音的识别结果,其中,所述语音模型通过如上述实施例之一所述的方法生成。
第三方面,本公开的一些实施例提供了一种生成语音模型装置,装置包括:获取单元,配置用于获取训练样本集,其中,训练样本集中的训练样本包括语音样本和语音样本对应的识别结果样本;训练单元,配置用于根据训练样本集,对初始模型进行联合学习训练,得到语音模型,其中,初始模型包括多层输出层。
第四方面,本公开的一些实施例提供了一种语音识别装置,装置包括:目标语音获取单元,被配置成获取目标语音;识别单元,被配置成将所述目标语音输入至预先训练的语音模型,得到所述目标语音的识别结果,其中,所述语音模型通过如上述实施例之一所述的方法生成。
第五方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面或第二方面中任一实现方式描述的方法。
第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面或第二方面中任一实现方式描述的方法。
本公开的上述各个实施例中的一个实施例具有如下有益效果:首先,获取训练样本集,而后根据训练样本集对初始模型进行联合学习训练,得到语音模型。因为上述训练样本集中的语音样本和上述训练样本集中的识别结果样本相匹配,所以经过训练得到的语音模型更具有准确性。使用联合学习训练方法对初始模型进行训练的过程则更加简单对样本的需求数量较少,更加具有灵活性,从而本公开可以有效的利用较少的样本,实现了训练过程的简化和语音模型的识别准确率的提高。
本公开的上述各个实施例中的一个实施例具有如下有益效果:首先,获取目标语音,之后,将上述目标语音输入至至预先训练的语音模型,得到所述目标语音的识别结果。使用训练完成的语音模型使对目标语音的识别结果更加准确,实现了识别结果准确度的提升以及用户体验的提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010165847.0/2.html,转载请声明来源钻瓜专利网。