[发明专利]语音识别方法、设备及存储介质有效
申请号: | 201811038734.3 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109036379B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 魏利开 | 申请(专利权)人: | 百度时代网络技术(北京)有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/26;G10L15/28 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100193 北京市海淀区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 设备 存储 介质 | ||
本发明公开了语音识别方法、设备及存储介质,其中方法包括:第一识别设备对待识别的音频进行离线识别,得到中间态识别数据;第一识别设备将中间态识别数据发送给第二识别设备,以便第二识别设备根据中间态识别数据在线生成最终识别结果。应用本发明所述方案,能够减小网络侧的计算量,并确保识别结果的准确性等。
【技术领域】
本发明涉及计算机应用技术,特别涉及语音识别方法、设备及存储介质。
【背景技术】
随着科技的发展,语音识别技术的应用越来越广泛。语音识别所要解决的问题是让计算机能够“听懂”人类的语音,将语音转换成计算机可读的输入如文本。
目前,在进行语音识别时,可采用在线识别方式或离线识别方式。离线识别方式指不依赖于网络的识别方式。
其中,离线识别方式不需要依赖于网络,识别速度快,但识别结果的准确性较差。在线识别方式的识别结果的准确性虽然较高,但是严重依赖于网络,会增大网络侧的计算量等。
【发明内容】
有鉴于此,本发明提供了语音识别方法、设备及存储介质。
具体技术方案如下:
一种语音识别方法,包括:
第一识别设备对待识别的音频进行离线识别,得到中间态识别数据;
所述第一识别设备将所述中间态识别数据发送给第二识别设备,以便所述第二识别设备根据所述中间态识别数据在线生成最终识别结果。
根据本发明一优选实施例,所述中间态识别数据包括:所述音频对应的音素串;
所述第一识别设备将所述中间态识别数据发送给第二识别设备包括:
所述第一识别设备将所述音素串发送给所述第二识别设备,以便所述第二识别设备根据所述音素串在线生成所述最终识别结果。
根据本发明一优选实施例,所述中间态识别数据包括:所述音频的离线识别结果;
所述第一识别设备将所述中间态识别数据发送给第二识别设备包括:
所述第一识别设备将所述离线识别结果发送给所述第二识别设备,以便所述第二识别设备对所述离线识别结果进行在线纠错,得到所述最终识别结果。
一种语音识别方法,包括:
第二识别设备获取来自第一识别设备的中间态识别数据,所述中间态识别数据为所述第一识别设备对待识别的音频进行离线识别得到的;
所述第二识别设备根据所述中间态识别数据在线生成最终识别结果。
根据本发明一优选实施例,所述中间态识别数据包括:所述音频对应的音素串;
所述第二识别设备根据所述中间态识别数据在线生成最终识别结果包括:所述第二识别设备根据所述音素串在线生成所述最终识别结果。
根据本发明一优选实施例,所述中间态识别数据包括:所述音频的离线识别结果;
所述第二识别设备根据所述中间态识别数据在线生成最终识别结果包括:所述第二识别设备对所述离线识别结果进行在线纠错,得到所述最终识别结果。
一种语音识别设备,包括:第一识别单元以及数据发送单元;
所述第一识别单元,用于对待识别的音频进行离线识别,得到中间态识别数据;
所述数据发送单元,用于将所述中间态识别数据发送给第二识别设备,以便所述第二识别设备根据所述中间态识别数据在线生成最终识别结果。
根据本发明一优选实施例,所述中间态识别数据包括:所述音频对应的音素串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度时代网络技术(北京)有限公司,未经百度时代网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811038734.3/2.html,转载请声明来源钻瓜专利网。