[发明专利]语音识别方法及相关装置、电子设备和存储介质在审

申请号：	202210514378.8	申请日：	2022-05-11
公开（公告）号：	CN114842833A	公开（公告）日：	2022-08-02
发明（设计）人：	宣璇;方磊;周振昆;胡鹏;方四安	申请（专利权）人：	合肥讯飞数码科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26;G10L19/04
代理公司：	深圳市威世博知识产权代理事务所(普通合伙) 44280	代理人：	刘希
地址：	230000 安徽省合肥市(安徽)自由贸易试***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法相关装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音识别方法及相关装置、电子设备和存储介质，其中，语音识别方法包括：获取待识别语音；基于语音识别模型对待识别语音进行识别，得到识别文本；其中，语音识别模型包括编码网络和解码网络，编码网络基于样本第一干净语音经特征聚类并量化后的帧级第一量化特征、样本第一带噪语音的帧级带噪语音特征之间的对比损失训练得到，样本第一带噪语音由样本第一干净语音加噪得到，解码网络在编码网络训练收敛之后基于样本第二带噪语音进行有监督训练得到。上述方案，够在低信噪比和低资源的场景下，提升语音识别性能。

技术领域

本申请涉及语音识别技术领域，特别是涉及一种语音识别方法及相关装置、电子设备和存储介质。

背景技术

语音识别是指对输入语音进行识别，将语音信息自动转化为文字。目前，低信噪比、低资源是当前语音识别技术面临的重要难题。

具体来说，低资源方面，由于缺乏丰富且标注的训练数据，语音识别模型难以得到充分学习，而低信噪比方面，常规方式难以提取带噪语音中的有效表征信息，其语音识别结果出现剧烈下降，无法满足低信噪比条件下的低资源语音识别需求。然而，在现实场景中，受传输介质、传输协议等通信条件以及环境噪声等影响，难免存在低信噪比的语音需要对其识别。有鉴于此，如何在低信噪比且低资源的场景下，提升语音识别性能，成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种语音识别方法及相关装置、电子设备和存储介质，能够在低信噪比且低资源的场景下，提升语音识别性能。

为了解决上述技术问题，本申请第一方面提供了一种语音识别方法，包括：获取待识别语音；基于语音识别模型对待识别语音进行识别，得到识别文本；其中，语音识别模型包括编码网络和解码网络，编码网络基于样本第一干净语音经特征聚类并量化后的帧级第一量化特征、样本第一带噪语音的帧级带噪语音特征之间的对比损失训练得到，样本第一带噪语音由样本第一干净语音加噪得到，解码网络在编码网络训练收敛之后基于样本第二带噪语音进行有监督训练得到。

为了解决上述技术问题，本申请第一方面提供了一种语音识别装置，包括：获取模块和识别模块，获取模块，用于获取待识别语音；识别模块，用于基于语音识别模型对待识别语音进行识别，得到识别文本；其中，语音识别模型包括编码网络和解码网络，编码网络基于样本第一干净语音量化后的帧级第一量化特征、样本第一带噪语音的帧级带噪语音特征之间的对比损失训练得到，样本第一带噪语音由样本第一干净语音加噪得到，解码网络在编码网络训练收敛之后基于标注有样本识别文本的样本第二带噪语音训练得到。

为了解决上述技术问题，本申请第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的语音识别方法。

为了解决上述技术问题，本申请第四方面提供了一种计算机可读存储介质，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面的语音识别方法。

上述方案，获取待识别语音，并基于语音识别模型对待识别语音进行识别，得到识别文本，且语音识别模型包括编码网络和解码网络，编码网络基于样本第一干净语音经特征聚类并量化后的帧级第一量化特征、样本第一带噪语音的帧级带噪语音特征之间的对比损失训练得到，而样本第一带噪语音由样本第一干净语音加噪得到，解码网络在编码网络训练收敛之后基于样本第二带噪语音进行有监督训练得到，一方面编码网络的训练通过语音特征对比进行无监督训练即可完成，而解码网络在编码网络训练收敛之后再进行有监督训练，故能够尽可能地减少对标注数据的需求，从而适应于低资源场景，另一方面通过构建样本第一带噪语音和样本第一干净语音的对比预测任务，能够使编码网络学习干净语音从带噪语音尽可能地提取有效的语音表征，从而适应于低信噪比场景。故此，通过编码网络进行无监督的对比预测任务，且解码网络进行有监督的识别预测任务，能够在低信噪比和低资源的场景下，提升语音识别性能。

附图说明

图1是本申请语音识别方法一实施例的流程示意图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司，未经合肥讯飞数码科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210514378.8/2.html，转载请声明来源钻瓜专利网。

上一篇：电连接器、连接器组件以及电连接器的制造方法
下一篇：一种自发热风机

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法及相关装置、电子设备和存储介质在审

专利文献下载