[发明专利]一种语音识别方法、装置、设备及存储介质在审

申请号：	202011017310.6	申请日：	2020-09-24
公开（公告）号：	CN112216283A	公开（公告）日：	2021-01-12
发明（设计）人：	马加宁	申请（专利权）人：	建信金融科技有限责任公司
主分类号：	G10L15/26	分类号：	G10L15/26;G06F9/445;H04M1/72454
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	200120 上海市浦东新区中国(***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音识别方法、装置、设备及存储介质。方法包括：通过加速度传感器和角速度传感器对语音信号进行采集，得到与语音信号对应的加速度信号和角速度信号；通过预设的信号过滤法规则，对加速度信号和角速度信号进行过滤；将过滤后的加速度信号和过滤后的角速度信号输入至预设的语音重组模型中，输出与语音信号对应的重组语音信号；将重组语音信号输入至预设的语音识别模型中，输出与重组语音信号对应的文本信息；在检测到文本信息中包含唤醒词时，对终端设备或终端设备的预设应用进行唤醒。本发明实施例可以在用户无感知的情况下进行唤醒识别，既能保证唤醒识别效率又做到无干扰，提高用户体验。

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种语音识别方法、装置、设备及存储介质。

背景技术

随着科技的不断进步，语音控制技术逐渐普及。大多数的终端设备基本具有可以进行语音交互的对话系统。通过和终端设备的对话系统进行语音交互，使得对终端设备的操作变得更加简单、便捷。用户每次在和终端设备或者终端设备中的应用进行交互之前，需要使用固定的唤醒词唤醒终端设备，等到终端设备或者终端设备中的应用进入唤醒状态后，进行语音交互。

相关技术中，终端设备上的语音识别的技术都是基于获取终端设备的麦克风权限后，使用麦克风获取可识别的音频内容进行分析。终端设备需要调用麦克风获取音频内容进行唤醒识别。

由于麦克风权限在终端设备操作系统中(Android/iOS/等)属于较高的权限，需要用户同意方可调用打开使用。因此，相关技术中，需要终端设备的用户同意，方可调用麦克风获取音频内容进行唤醒识别。此外，终端设备调用麦克风获取音频内容进行唤醒识别时，会停止终端设备的其它冲突应用进程，如音频播放、视频播放、录制等，无法在不中断会与麦克风权限冲突的应用进程的情况下完成唤醒识别，而应用进程经常中断会导致用户体验非常不佳。

发明内容

本发明实施例提供一种语音识别方法、装置、设备及存储介质，可以在用户无感知的情况下进行唤醒识别，提高用户体验。

第一方面，本发明实施例提供了一种语音识别方法，包括：

通过加速度传感器和角速度传感器对语音信号进行采集，得到与所述语音信号对应的加速度信号和角速度信号；

通过预设的信号过滤法规则，对所述加速度信号和所述角速度信号进行过滤；

将过滤后的所述加速度信号和过滤后的所述角速度信号输入至预设的语音重组模型中，输出与所述语音信号对应的重组语音信号；

将所述重组语音信号输入至预设的语音识别模型中，输出与所述重组语音信号对应的文本信息；

在检测到所述文本信息中包含唤醒词时，对终端设备或终端设备的预设应用进行唤醒。

第二方面，本发明实施例还提供了一种语音识别装置，包括：

信号采集模块，用于通过加速度传感器和角速度传感器对语音信号进行采集，得到与所述语音信号对应的加速度信号和角速度信号；

信号过滤模块，用于通过预设的信号过滤法规则，对所述加速度信号和所述角速度信号进行过滤；

信号重组模块，用于将过滤后的所述加速度信号和过滤后的所述角速度信号输入至预设的语音重组模型中，输出与所述语音信号对应的重组语音信号；