[发明专利]一种语音识别方法及装置有效
申请号: | 201910865885.4 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110610697B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 汪俊;闫博群;李索恒;张志齐;郑达 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G10L15/28 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王娜 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
本发明实施例提供一种语音识别方法及装置,涉及信息技术领域,方法包括:获取待识别音频数据,待识别音频数据由n个时刻的子音频数据构成,其中n大于等于1;针对第i个时刻的子音频数据,将子音频数据输入至第一语音识别模型中的第i个处理模块以及第二语音识别模型中的第i个处理模块,分别得到第一识别结果以及第二识别结果,第一语音识别模型的计算时间与第二语音识别模型的计算时间匹配,第一语音识别模型的计算维度大于第二语音识别模型的计算维度;根据第一识别结果以及第二识别结果确定第i个时刻的子音频数据的文本识别结果。提高了语音识别的实时性。
技术领域
本发明实施例涉及信息技术领域,尤其涉及一种语音识别方法及装置。
背景技术
随着通信技术的发展,智能终端的普及,各种网络通讯工具成为大众沟通的主要工具之一。其中由于语音信息的操作和传输的便捷性,成为各种网络通讯工具的主要传输信息。而在使用各种网络通讯工具时,还涉及到将语音信息进行文本转换的过程,该过程就是语音识别技术。
语音识别技术是使得机器通过识别和理解过程把语音信息转变为相应的文本或命令的技术。在使用深度学习的方法进行语音识别时,需要通过当前时刻的语音信息以及当前时刻的上下文信息来确定语音识别结果,但是由于当前时刻的语音信息的计算时间与上下文信息的计算时间不匹配,所以导致现有技术中语音识别结果输出滞后,不能满足实时性的要求。
发明内容
本发明实施例提供一种语音识别方法及装置,能够使当前时刻的语音信息的计算时间与上下文信息的计算时间匹配,满足实时性的要求。
一方面,本发明实施例提供一种语音识别方法,所述方法应用于语音识别系统,所述语音识别系统至少包括第一语音识别模型以及第二语音识别模型,所述第一语音识别模型具有n个处理模块,每个模块具有一个输入端以及对应的输出端,所述第二语音识别模型具有n个处理模块,每个模块具有一个输入端以及对应的输出端,所述方法包括:
获取待识别音频数据,所述待识别音频数据由n个时刻的子音频数据构成,其中n大于等于1;
针对第i个时刻的子音频数据,将所述子音频数据输入至第一语音识别模型中的第i个处理模块以及第二语音识别模型中的第i个处理模块,分别得到第一识别结果以及第二识别结果,所述第一识别结果是根据所述待识别音频中第1个时刻到第i个时刻的子音频数据确定的,所述第二识别结果是根据所述待识别音频中第i个时刻到第n个时刻的子音频数据确定的,所述第一语音识别模型中的每个处理模型对应一个时刻的子音频数据,所述第二语音识别模型中的每个处理模型对应一个时刻的子音频数据,所述第一语音识别模型的计算时间与所述第二语音识别模型的计算时间匹配,所述第一语音识别模型的计算维度大于所述第二语音识别模型的计算维度,i是根据所述第一语音识别模型的计算维度与所述第二语音识别模型的计算维度确定的,i属于n;
根据所述第一识别结果以及所述第二识别结果确定所述第i个时刻的子音频数据的文本识别结果。
可选的,针对第i个时刻的子音频数据,将所述子音频数据输入至第一语音识别模型中的第i个处理模块以及第二语音识别模型中的第i个处理模块,分别得到第一识别结果以及第二识别结果,包括:
将第1时刻的子音频数据输入至所述第一语音识别模型中的第1个处理模块,得到第1时刻的子音频数据的第一识别结果,将所述第1时刻的子音频数据的第一识别结果以及第2时刻的子音频数据作为所述第一语音识别模型中的第2个处理模块的输入数据,得到第2时刻的子音频数据的第一识别结果,将所述第2时刻的子音频数据的第一识别结果以及第3时刻的子音频数据作为所述第一语音识别模型中的第3个处理模块的输入数据,得到第3时刻的子音频数据的第一识别结果,以此类推得到第i时刻的子音频数据的第一识别结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910865885.4/2.html,转载请声明来源钻瓜专利网。