[发明专利]用于便携式终端的语音检测方法和语音检测装置在审
申请号: | 201410374671.4 | 申请日: | 2014-07-31 |
公开(公告)号: | CN104134440A | 公开(公告)日: | 2014-11-05 |
发明(设计)人: | 刘俊启 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L21/02 |
代理公司: | 北京天健君律专利代理事务所(普通合伙) 11461 | 代理人: | 逯博;罗延红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 便携式 终端 语音 检测 方法 装置 | ||
本发明提供一种用于便携式终端的语音检测方法和语音检测装置。所述语音检测方法包括:检测所述便携式终端的运动;根据检测到的所述运动相对于语音声源的改变,设置用于语音识别的语音能量阈值。通过检测便携式终端的运动并且根据该运动相对于语音声源的改变,动态地设置用于语音识别的语音能量阈值;基于动态设置的语音能量阈值,可较为准确地识别用户语音的开始点和结束点,提高语音识别的准确性。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种用于便携式终端的语音检测方法和装置。
背景技术
在例如语音识别的涉及语音检测的技术中,需要准确地检测语音的开始点和结束点,获取有效的语音数据并执行相应的处理(例如,录音并将录音数据上传至服务器)。
现有技术中,对语音开始点与结束点的检测均需参照预先设置的语音能量阈值,将检测到的语音的能量从低于所述语音能量阈值变为高于所述语音能量阈值的时间点认为是用户语音(讲话)的开始点;将检测到的语音的能量从高于所述语音能量阈值变为低于所述语音能量阈值且保持一段时间不变,认为是用户语音(讲话)的结束点。
然而,针对不同的用户、不同的场景,设置统一的语音能量阈值影响语音检测的准确性和效果。图3~图5示出了现有技术的语音能量检测效果图。
图3示出了当用户讲话的语音能量较小或便携式终端距离语音声源较远时,语音能量的检测效果图。可以看出,便携式终端的录音数据的音量偏低。在这种情况下,如果便携式终端的语音识别的语音能量阈值设置较高,则可能导致语音数据的丢失和影响语音识别的准确性,甚至无法录音。
图4示出了在用户讲话的语音能量较大或便携式终端距离语音声源较近的情况下语音能量的检测效果图。与图3示出的刚好相反,图4中录音数据的音量偏高。在这种情况下,如果便携式终端的语音识别的语音能量阈值设置较低,则可能在录音过程中引入噪声,从而影响语音识别的准确性。
图5示出了在环境较嘈杂或便携式终端与语音声源距离变化,且语音识别的语音能量阈值设置较低情况下,语音能量的检测效果图。可以看出,在语音检测过程中,由于语音能量阈值设置较低,将背景音(噪声)认为是有效数据,导致语音识别的开始点认定过早;而如果将语音能量阈值设置较高,则在如图3中所示的情况下,又可能检测不到语音的开始点。
此外,在例如智能手机、平板电脑等的便携式终端在运动状态下使用语音识别功能时,会导致接收到的语音能量和录音的音量不稳定,从而影响语音数据的识别的准确性以及用户语音的开始点和结束点的检测。
发明内容
本发明的目的在于提供一种用于便携式终端的语音检测方法和装置,根据便携式终端的运动相对于语音声源的改变设置用于识别的语音能量阈值,从而在运动状态下能够较为准确地识别有效的语音数据。
根据本发明的一方面,提供一种用于便携式终端的语音检测方法,包括:检测所述便携式终端的运动;根据检测到的所述运动相对于语音声源的改变,设置用于语音识别的语音能量阈值。
根据本发明的另一方面,提供一种用于便携式终端的语音检测装置,所述语音检测装置包括:运动检测单元,用于检测所述便携式终端的运动;阈值设置单元,用于根据所述运动检测单元检测到的所述运动相对于语音声源的改变,设置用于语音识别的语音能量阈值。
本发明的用于便携式终端的语音检测方法和装置通过检测便携式终端的运动并且根据该运动相对于语音声源的改变,动态地设置用于语音识别的语音能量阈值;基于动态设置的语音能量阈值,可较为准确地识别用户语音的开始点和结束点,提高语音识别的准确性。
此外,对于需要通过网络上传语音数据的情形,根据便携式终端的运动相对于语音声源的改变来调整录音数据的音量,对采集的语音数据进行调优处理,有助于进行更清晰、稳定的语音识别。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410374671.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种STT-MRAM存储单元
- 下一篇:位移控制单元