[发明专利]一种语音识别方法、装置、设备及存储介质在审
申请号: | 202011017310.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112216283A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 马加宁 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F9/445;H04M1/72454 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种语音识别方法、装置、设备及存储介质。方法包括:通过加速度传感器和角速度传感器对语音信号进行采集,得到与语音信号对应的加速度信号和角速度信号;通过预设的信号过滤法规则,对加速度信号和角速度信号进行过滤;将过滤后的加速度信号和过滤后的角速度信号输入至预设的语音重组模型中,输出与语音信号对应的重组语音信号;将重组语音信号输入至预设的语音识别模型中,输出与重组语音信号对应的文本信息;在检测到文本信息中包含唤醒词时,对终端设备或终端设备的预设应用进行唤醒。本发明实施例可以在用户无感知的情况下进行唤醒识别,既能保证唤醒识别效率又做到无干扰,提高用户体验。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种语音识别方法、装置、设备及存储介质。
背景技术
随着科技的不断进步,语音控制技术逐渐普及。大多数的终端设备基本具有可以进行语音交互的对话系统。通过和终端设备的对话系统进行语音交互,使得对终端设备的操作变得更加简单、便捷。用户每次在和终端设备或者终端设备中的应用进行交互之前,需要使用固定的唤醒词唤醒终端设备,等到终端设备或者终端设备中的应用进入唤醒状态后,进行语音交互。
相关技术中,终端设备上的语音识别的技术都是基于获取终端设备的麦克风权限后,使用麦克风获取可识别的音频内容进行分析。终端设备需要调用麦克风获取音频内容进行唤醒识别。
由于麦克风权限在终端设备操作系统中(Android/iOS/等)属于较高的权限,需要用户同意方可调用打开使用。因此,相关技术中,需要终端设备的用户同意,方可调用麦克风获取音频内容进行唤醒识别。此外,终端设备调用麦克风获取音频内容进行唤醒识别时,会停止终端设备的其它冲突应用进程,如音频播放、视频播放、录制等,无法在不中断会与麦克风权限冲突的应用进程的情况下完成唤醒识别,而应用进程经常中断会导致用户体验非常不佳。
发明内容
本发明实施例提供一种语音识别方法、装置、设备及存储介质,可以在用户无感知的情况下进行唤醒识别,提高用户体验。
第一方面,本发明实施例提供了一种语音识别方法,包括:
通过加速度传感器和角速度传感器对语音信号进行采集,得到与所述语音信号对应的加速度信号和角速度信号;
通过预设的信号过滤法规则,对所述加速度信号和所述角速度信号进行过滤;
将过滤后的所述加速度信号和过滤后的所述角速度信号输入至预设的语音重组模型中,输出与所述语音信号对应的重组语音信号;
将所述重组语音信号输入至预设的语音识别模型中,输出与所述重组语音信号对应的文本信息;
在检测到所述文本信息中包含唤醒词时,对终端设备或终端设备的预设应用进行唤醒。
第二方面,本发明实施例还提供了一种语音识别装置,包括:
信号采集模块,用于通过加速度传感器和角速度传感器对语音信号进行采集,得到与所述语音信号对应的加速度信号和角速度信号;
信号过滤模块,用于通过预设的信号过滤法规则,对所述加速度信号和所述角速度信号进行过滤;
信号重组模块,用于将过滤后的所述加速度信号和过滤后的所述角速度信号输入至预设的语音重组模型中,输出与所述语音信号对应的重组语音信号;
信号识别模块,用于将所述重组语音信号输入至预设的语音识别模型中,输出与所述重组语音信号对应的文本信息;
设备唤醒模块,用于在检测到所述文本信息中包含唤醒词时,对终端设备或终端设备的预设应用进行唤醒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011017310.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柔性导电薄膜常温低压转印方法
- 下一篇:道岔转辙机故障识别方法及装置