[发明专利]语音识别方法和电子设备、存储装置有效
申请号: | 202011378944.4 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112489651B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 吴重亮;万根顺;高建清;刘聪;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 电子设备 存储 装置 | ||
本申请公开了一种语音识别方法和电子设备、存储装置,其中,语音识别方法包括:获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表;对原始音频进行初始识别,得到初始识别文本;从第一参考列表中,筛选与初始识别文本满足第一预设条件的参考词语,得到第二参考列表;利用第二参考列表,对原始音频进行最终识别,得到最终识别文本。上述方案,能够提高语音识别准确性。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种语音识别方法和电子设备、存储装置。
背景技术
在语音识别场景中,往往会遇到与语音识别场景相关的词语。例如,在人工智能领域会议中,通常会涉及诸如池化、端到端等词语,此外,还可能涉及该领域相关的人名、与会人员名字等等。受此影响,语音识别准确性往往较差。有鉴于此,如何提高语音识别准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种语音识别方法和电子设备、存储装置,能够确提高语音识别准确性。
为了解决上述问题,本申请第一方面提供了一种语音识别方法,包括:获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表;对原始音频进行初始识别,得到初始识别文本;从第一参考列表中,筛选与初始识别文本满足第一预设条件的参考词语,得到第二参考列表;利用第二参考列表,对原始音频进行最终识别,得到最终识别文本。
为了解决上述问题,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的语音识别方法。
为了解决上述问题,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的语音识别方法。
上述方案,通过获取语音识别场景下采集到的原始音频和与语音识别场景相关的第一参考列表,从而对原始音频进行初始识别,得到初始识别文本,并从第一参考列表中,筛选与初始识别文本满足第一预设条件的参考词语,得到第二参考列表,进而利用第二参考列表,对原始音频进行最终识别,得到最终识别文本,故此能够在语音识别过程中,对原始音频进行二次识别,并在初始识别之后,利用初始识别文本进一步缩减第一参考列表,从而能够排除与原始音频无关的参考词语对语音识别的干扰,有利于提高第二参考列表的精准性,进而在最终识别时,利用第二参考列表识别原始音频,有利于提高语音识别准确性。
附图说明
图1是本申请语音识别方法一实施例的流程示意图;
图2是语音识别模型一实施例的框架示意图;
图3是图1中步骤S14一实施例的流程示意图;
图4是图3中步骤S32一实施例的流程示意图;
图5是利用第二参考列表进行最终识别一实施例的状态示意图;
图6是语音识别模型训练方法一实施例的流程示意图;
图7是预设缩放系数设置方式一实施例的流程示意图;
图8是本申请电子设备一实施例的框架示意图;
图9是本申请存储装置一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011378944.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智慧车站的管控平台
- 下一篇:家用电器租赁控制方法、装置、家用电器及存储介质