[发明专利]语音识别方法和电子设备、存储装置有效

申请号：	202011378944.4	申请日：	2020-11-30
公开（公告）号：	CN112489651B	公开（公告）日：	2023-02-17
发明（设计）人：	吴重亮;万根顺;高建清;刘聪;王智国;胡国平	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/06;G10L15/26
代理公司：	深圳市威世博知识产权代理事务所(普通合伙) 44280	代理人：	何倚雯
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法电子设备存储装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音识别方法和电子设备、存储装置，其中，语音识别方法包括：获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表；对原始音频进行初始识别，得到初始识别文本；从第一参考列表中，筛选与初始识别文本满足第一预设条件的参考词语，得到第二参考列表；利用第二参考列表，对原始音频进行最终识别，得到最终识别文本。上述方案，能够提高语音识别准确性。

技术领域

本申请涉及语音识别技术领域，特别是涉及一种语音识别方法和电子设备、存储装置。

背景技术

在语音识别场景中，往往会遇到与语音识别场景相关的词语。例如，在人工智能领域会议中，通常会涉及诸如池化、端到端等词语，此外，还可能涉及该领域相关的人名、与会人员名字等等。受此影响，语音识别准确性往往较差。有鉴于此，如何提高语音识别准确性成为亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种语音识别方法和电子设备、存储装置，能够确提高语音识别准确性。

为了解决上述问题，本申请第一方面提供了一种语音识别方法，包括：获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表；对原始音频进行初始识别，得到初始识别文本；从第一参考列表中，筛选与初始识别文本满足第一预设条件的参考词语，得到第二参考列表；利用第二参考列表，对原始音频进行最终识别，得到最终识别文本。

为了解决上述问题，本申请第二方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的语音识别方法。

为了解决上述问题，本申请第三方面提供了一种存储装置，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面中的语音识别方法。

上述方案，通过获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表，从而对原始音频进行初始识别，得到初始识别文本，并从第一参考列表中，筛选与初始识别文本满足第一预设条件的参考词语，得到第二参考列表，进而利用第二参考列表，对原始音频进行最终识别，得到最终识别文本，故此能够在语音识别过程中，对原始音频进行二次识别，并在初始识别之后，利用初始识别文本进一步缩减第一参考列表，从而能够排除与原始音频无关的参考词语对语音识别的干扰，有利于提高第二参考列表的精准性，进而在最终识别时，利用第二参考列表识别原始音频，有利于提高语音识别准确性。

附图说明

图1是本申请语音识别方法一实施例的流程示意图；

图2是语音识别模型一实施例的框架示意图；

图3是图1中步骤S14一实施例的流程示意图；

图4是图3中步骤S32一实施例的流程示意图；

图5是利用第二参考列表进行最终识别一实施例的状态示意图；

图6是语音识别模型训练方法一实施例的流程示意图；

图7是预设缩放系数设置方式一实施例的流程示意图；

图8是本申请电子设备一实施例的框架示意图；

图9是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。