[发明专利]语音识别方法、装置、计算机设备和存储介质在审

申请号：	202210814534.2	申请日：	2022-07-12
公开（公告）号：	CN115050371A	公开（公告）日：	2022-09-13
发明（设计）人：	马夺;张智超	申请（专利权）人：	深圳市普渡科技有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/06
代理公司：	华进联合专利商标代理有限公司 44224	代理人：	郑义
地址：	518051 广东省深圳市南山区西丽***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取目标领域的音频样本和对应所述音频样本的第一文本样本，以及未对应所述音频样本的目标领域的第二文本样本；基于所述第二文本样本对训练前的语音识别网络中的解码器进行训练；当所述语音识别网络的收敛程度达到第一收敛条件时，基于所述音频样本和所述第一文本样本对所述语音识别网络中的编码器和解码器进行训练，直至所述语音识别网络的收敛程度达到第二收敛条件，得到训练后的语音识别网络；通过所述训练后的语音识别网络对待识别语音进行识别，得到识别文本。采用本方法能够提高语音识别的准确性。

技术领域

本申请涉及人工智能技术领域，特别是涉及一种语音识别方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着人工智能技术的发展，语音识别技术得到广泛应用。语音识别技术是将人类语音中的内容转换为计算机可读的输入，从而实现人机交互。传统技术中，由于特定领域(例如，餐饮领域、旅游业领域)的待识别语音包含特殊的文法结构和专有名词，且语音中可能包含较大噪声，导致语音识别的准确性低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高语音识别准确性的语音识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种语音识别方法。所述方法包括：

获取目标领域的音频样本和对应所述音频样本的第一文本样本，以及未对应所述音频样本的目标领域的第二文本样本；

基于所述第二文本样本对训练前的语音识别网络中的解码器进行训练；

当所述语音识别网络的收敛程度达到第一收敛条件时，基于所述音频样本和所述第一文本样本对所述语音识别网络中的编码器和解码器进行训练，直至所述语音识别网络的收敛程度达到第二收敛条件，得到训练后的语音识别网络；

通过所述训练后的语音识别网络对待识别语音进行识别，得到识别文本。

第二方面，本申请还提供了一种语音识别装置。所述装置包括：