[发明专利]一种语音识别方法、装置、存储介质及空调有效
申请号: | 201910130206.9 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109767769B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 李明杰;宋德超;贾巨涛;吴伟;谢俊杰 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L21/0216;G01S13/86;G01S13/06;G01S3/80 |
代理公司: | 北京煦润律师事务所 11522 | 代理人: | 朱清娟;梁永芳 |
地址: | 519070 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 存储 介质 空调 | ||
本发明公开了一种语音识别方法、装置、存储介质及空调,该方法包括:获取第一语音数据;根据所述第一语音数据调整第二语音数据的采集状态,并基于调整后的采集状态获取第二语音数据;利用预设的远场语音识别模型对获取的第二语音数据进行远场语音识别,以得到与获取的第二语音数据对应的语义信息。本发明的方案,可以解决利用深度学习方法或麦克风阵列方法去除远场语音数据中的混响和噪音,存在远场语音识别效果差的问题,达到提升远场语音识别效果的效果。
技术领域
本发明属于语音控制技术领域,具体涉及一种语音识别方法、装置、存储介质及空调,尤其涉及一种基于微波雷达的远场语音识别方法、装置、存储介质及空调。
背景技术
语音识别技术是目前应用较为成熟的人机交互方式,从最初的手持设备这种近场的语音识别,如Sirfi语音识别以及各种语音助手,到现在,语音识别的应用已经完成向智能硬件、家电设备、机器人等领域上的延伸。但新的人机交互方式对硬件、软件、算法等方面的要求更加苛刻,特别是远场语音识别技术面临巨大的挑战。
随着智能家居系统的不断发展,智能家居如语音空调属于远场语音识别技术。首先,人机之间的语音交互(这里主要指智能硬件、机器人等),区别于传统的有屏手持设备,在传统的语音交互中,因为是近场,语音信号质量相对较高,而且有触摸屏辅助,所以交互链路可以相对简单。通过点击屏幕触发,再通过点击屏幕或者能量VAD(Voice ActivityDetection,语音活动检测)检测,来结束语音信号采集,即可完成一次交互,整个过程通过语音识别、语义理解、语音合成即可完成。
而对于人机之间的交互,由于涉及到远场,环境比较复杂,而且无屏交互,如果要像人与人之间的交流一样自然、持续、双向、可打断,整个交互过程需要解决的问题更多,为完成类似人类的语音交互,是一个需要软硬件一体、云+端相互配合的过程。
目前的语音识别算法的训练数据主要是利用手机上收集的语音进行训练,只适用近场识别。对于复杂的远场语音数据,存在大量的混响和噪音。现有技术主要是利用深度学习方法或麦克风阵列方法去除混响和噪音,在实际应用过程中无法同时感知声源的位置和方向数据,从而只能使用通用方法(例如:前端的麦克风阵列方法和后端的神经网络算法)去处理语音数据,存在远场语音识别率低、响应时间长、降噪效果差等问题。
其中,利用深度学习方法或麦克风阵列方法去除混响和噪音,可以包括:
(1)麦克风阵列方法:主要是在混响的场景下提高音波方向估计的鲁棒性。通过集成多个麦克风来检测波束的方向后,利用波束形成技术抑制周围的非平稳噪声。但由于产品价格和尺寸的限制,麦克风的个数及每个麦克风的间距有限,能够分辨的方向范围较小。
(2)深度学习方法:通过信号处理的手段对混响和噪声的语音数据进行过滤和单一化处理,利用DNN或RNN等算法替代波束形成技术,实现语音增强。但处理效果较差,尤其在噪声很大的环境里远场语音识别效果不好。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的目的在于,针对上述缺陷,提供一种语音识别方法、装置、存储介质及空调,以解决利用深度学习方法或麦克风阵列方法去除远场语音数据中的混响和噪音,存在远场语音识别效果差的问题,达到提升远场语音识别效果的效果。
本发明提供一种语音识别方法,包括:获取第一语音数据;根据所述第一语音数据调整第二语音数据的采集状态,并基于调整后的采集状态获取第二语音数据;利用预设的远场语音识别模型对获取的第二语音数据进行远场语音识别,以得到与获取的第二语音数据对应的语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910130206.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离线语音控制智能灯光系统
- 下一篇:一种车载语音导航和语音聊天系统