[发明专利]一种语音识别系统和方法在审
申请号: | 201810758940.5 | 申请日: | 2018-07-11 |
公开(公告)号: | CN109036431A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 余启洪;柳青;宋征轩;张海龙 | 申请(专利权)人: | 北京智能管家科技有限公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34;G10L15/26;H04L29/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 101500 北京市密云区经济开发*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理模块 引擎 调度模块 引擎资源 语音识别系统 目标引擎 语音识别 语音数据 语音识别引擎 复杂设计 空闲状态 使用效率 状态选择 资源竞争 识别率 多路 去除 并发 语音 调度 | ||
本发明实施例公开了一种语音识别系统和方法,所述系统包括:引擎资源调度模块和至少两个引擎处理模块;其中,所述引擎资源调度模块用于根据所述至少两个引擎处理模块的状态选择目标引擎处理模块;所述至少两个引擎处理模块中的目标引擎处理模块用于对接收到的语音数据进行语音识别。由于引擎资源调度模块对引擎处理模块的调度,可以让处于空闲状态的引擎处理模块进行语音识别,避免了多个语音数据同时由一个引擎处理模块处理时造成的资源竞争,降低识别效率的问题,实现了在高并发情况下提升语音识别引擎的识别率和使用效率,同时去除引擎处理模块识别多路语音的复杂设计。
技术领域
本发明涉及互联网技术领域,尤其涉及一种语音识别系统和方法。
背景技术
语音识别技术,也被称为自动语音识别(ASR,Automatic Speech Recognition),是要将人类的语音中的词汇内容转换为计算机可读的输入。目前,语音识别技术成为人工智能领域一项比较通用的技术。
现有技术中的语音识别系统作为一个整体,整合了所有的应用逻辑,不仅要处理语音数据的识别,还要处理多路数据的并发访问,以及各种引擎参数,模型的动态配置等等,这样的好处是可以方便部署,结构相对简单。但是由于系统过于庞大,维护升级不方便。同时,语音识别引擎只能单路识别语音数据,通过多线程支持识别引擎同一时刻处理多路音频数据是非常复杂,多线程处理多路音频数据容易出现bug,而且实现起来非常困难,因此,语音处理的可靠性和效率都低。
发明内容
本发明提供一种语音识别系统和方法,可以在高并发情况下提升语音识别引擎的识别率和使用效率。
第一方面,本发明实施例提供了一种语音识别系统,所述系统包括:引擎资源调度模块和至少两个引擎处理模块;
其中,所述引擎资源调度模块用于根据所述至少两个引擎处理模块的状态选择目标引擎处理模块;
所述至少两个引擎处理模块中的所述目标引擎处理模块用于对接收到的语音数据进行语音识别。
可选的,所述系统还包括:前置语音处理模块,用于接收用户发送的语音数据并对所述语音数据进行预处理,将预处理后的语音数据发送至所述目标引擎处理模块。
可选的,所述引擎资源调度模块还用于:
在选择目标引擎处理模块之后,将所述目标引擎处理模块的地址发送至所述前置语音模块;
相应的,所述前置语音处理模块具体用于:根据所述目标引擎处理模块的地址将预处理后的语音数据发送至所述目标引擎处理模块。
可选的,所述系统还包括:帐号校验模块,用于存储用户信息以及与用户帐号相关的引擎模型参数信息。
可选的,所述引擎资源调度模块还用于:从所述帐号校验模块中获取与当前用户账号相关的目标引擎模型参数信息,并发送至前置语音处理模块;
相应的,所述前置语音处理模块还用于根据所述目标引擎处理模块的地址将所述目标引擎模型参数信息发送至所述目标引擎处理模块;
相应的,所述目标引擎处理模块还用于依据所述目标引擎模型参数信息对接收到的语音数据进行语音识别。
可选的,所述帐号校验模块,还用于对发送所述语音数据的用户账号进行账号验证。
可选的,所述系统还包括:系统监控模块,用于对所述引擎资源调度模块和至少两个引擎处理模块的运行状态进行监控。
可选的,所述系统还包括:代理服务器模块,用于将用户发送的语音数据发送至所述前置语音处理模块。第二方面,本发明实施例还提供了一种语音识别方法,所述方法包括:
引擎资源调度模块根据至少两个引擎处理模块的状态选择目标引擎处理模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智能管家科技有限公司,未经北京智能管家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810758940.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制终端
- 下一篇:一种连麦方法、装置、设备及存储介质