[发明专利]语音处理方法、装置、电子设备以及存储介质在审

申请号：	202110615155.6	申请日：	2021-06-02
公开（公告）号：	CN113823272A	公开（公告）日：	2021-12-21
发明（设计）人：	曹松军;康跃腾;付彦喆;徐晓烁;孙思宁;张一珂;马龙	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/06	分类号：	G10L15/06
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	李汉亮
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法装置电子设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音处理方法、装置、电子设备以及存储介质，包括：获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型；根据第一语音样本对流式语音处理模型进行调整，得到调整后流式语音处理模型；基于第一语音样本、第二语音样本以及流式语音处理模型对应的教师模型，对流式语音处理模型进行训练，得到训练后流式语音处理模型；根据第一语音样本、基础语音模型以及语言模型对第二语音样本进行标注，得到标注后第二语音样本；基于第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行训练，得到目标语音处理模型，以通过目标语音处理模型对待处理语音进行处理。

技术领域

本发明涉及计算机技术领域，具体涉及一种语音处理方法、装置、电子设备以及存储介质。

背景技术

随着通信技术的发展，智能终端的普及，各种网络通讯工具成为大众沟通的主要工具之一。其中由于语音信息的操作和传输的便捷性，成为各种网络通讯工具的主要传输信息。而在使用各种网络通讯工具时，还涉及到将语音信息进行文本转换的过程，该过程就是语音识别技术。

目前，是通过语音识别模型来将语音信息转换为文本信息，然而，在实时语音识别的场景中，由于目前的语音识别模型需要利用全部的语音信息才能进行语音识别，并且，用户语句较为复杂，故，目前的语音识别效果较差，且交互成功率较低。

发明内容

本申请提供一种语音处理方法、装置、电子设备以及存储介质，可以提高在实时识别场景下的语音识别效果，从而提高交互成功率。

本申请提供了一种语音处理方法，包括：

获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型，所述基础语音模型包括非流式变换器，所述流式语音处理模型为将所述基础语音模型中的非流式变换器替换为流式变换器得到的；

根据所述第一语音样本对所述流式语音处理模型进行调整，得到调整后流式语音处理模型；

基于所述第一语音样本、第二语音样本以及所述流式语音处理模型对应的教师模型，对所述所述流式语音处理模型进行训练，得到训练后流式语音处理模型；

根据所述第一语音样本、基础语音模型以及语言模型对所述第二语音样本进行标注，得到标注后第二语音样本；

基于所述第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行训练，得到目标语音处理模型，以通过所述目标语音处理模型对待处理语音进行处理。

相应的，本申请还提供了一种语音处理装置，包括：

获取模块，用于获取已标注的第一语音样本、未标注的第二语音样本、预训练的基础语音模型、流式语音处理模型和语言模型，所述基础语音模型包括非流式变换器，所述流式语音处理模型为将所述基础语音模型中的非流式变换器替换为流式变换器得到的；

调整模块，用于根据所述第一语音样本对所述流式语音处理模型进行调整，得到调整后流式语音处理模型；

第一训练模块，用于基于所述第一语音样本、第二语音样本以及所述流式语音处理模型对应的教师模型，对所述所述流式语音处理模型进行训练，得到训练后流式语音处理模型；

标注模块，用于根据所述第一语音样本、基础语音模型以及语言模型对所述第二语音样本进行标注，得到标注后第二语音样本；

第二训练模块，用于基于所述第一语音样本和标注后第二语音样本对训练后流式语音处理模型进行训练，得到目标语音处理模型，以通过所述目标语音处理模型对待处理语音进行处理。

可选的，在本发明的一些实施例中，所述第一训练模块包括：

第一获取单元，用于获取所述流式语音处理模型对应的教师模型；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110615155.6/2.html，转载请声明来源钻瓜专利网。

上一篇：文本处理方法、装置、电子设备及存储介质
下一篇：游戏音乐风格分类方法、装置、可读介质及电子设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音处理方法、装置、电子设备以及存储介质在审

专利文献下载