[发明专利]一种语音端点检测方法及装置有效
申请号: | 201811468244.7 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109473092B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 韩雪;张新;毛跃辉;陶梦春;王慧君 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/20;G10L25/03;G10L25/87 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 江舟;董文倩 |
地址: | 519070 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 端点 检测 方法 装置 | ||
本发明提供了一种语音端点检测方法及装置,其中,该方法包括:检测是否接收到唤醒家用电器的唤醒词;根据检测的结果调节能量阈值E0和音频帧数M0;根据调节后的所述能量阈值E0和所述音频帧数M0对语音进行端点检测,其中,所述语音的前端点为之前连续音频帧数M0的音频能量小于所述能量阈值E0,且之后连续音频帧数M0的音频能量大于所述能量阈值E0的时间转折点;所述语音的后端点为之前连续音频帧数M0的音频能量大于所述能量阈值E0,且之后连续音频帧数M0的音频能量小于所述能量阈值E0的时间转折点,解决了相关技术中针对不同声音大小的环境下端点检测存在漏识别和误识别的问题,提高了语音识别的准确度。
技术领域
本发明涉及通信领域,具体而言,涉及一种语音端点检测方法及装置。
背景技术
语音端点检测是指从连续的一段语音中检测出有效语音段,包括检测有效语音的起始点与结束点。语音端点检测可以提取出语音流中提取用户想要的信息,减小传输与存储过程中的数据量,节省存储空间,提高传输速度。
目前,常用的语音端点检测的方法中,规定音频前面部分连续M0帧的能量值低于事先指定的能量值阈值E0,接下来连续M0帧能量值大于E0,则语音能量值增大的地方为有效语音的前端点。同样的,如果连续的若干帧语音能量值较大,随后的帧能量值变小,并且持续一段时长,则语音能量减小的地方为有效语音的后端点。
虽然该方法能够满足大部分语音起始点与结束点的检测,但在不同的场景下,环境声音大小不同,可能导致语音端点的漏识别与误识别。
针对相关技术中针对不同声音大小的环境下端点检测存在漏识别和误识别的问题,尚未提出解决方案。
发明内容
本发明实施例提供了一种语音端点检测方法及装置,以至少解决相关技术中针对不同声音大小的环境下端点检测存在漏识别和误识别的问题。
根据本发明的一个实施例,提供了一种语音端点检测方法,包括:
检测是否接收到唤醒家用电器的唤醒词;
根据检测的结果调节能量阈值E0和音频帧数M0;
根据调节后的所述能量阈值E0和所述音频帧数M0对语音进行端点检测,其中,所述语音的前端点为之前连续音频帧数M0的音频能量小于所述能量阈值E0,且之后连续音频帧数M0的音频能量大于所述能量阈值E0的时间转折点;所述语音的后端点为之前连续音频帧数M0的音频能量大于所述能量阈值E0,且之后连续音频帧数M0的音频能量小于所述能量阈值E0的时间转折点。
可选地,根据检测的结果调节能量阈值E0和音频帧数M0包括:
在检测的结果为未接收到唤醒家用电器的唤醒词的情况下,截取当前环境下语音中预定数量的音频帧数;
计算所述预定数量的音频帧数的第一平均能量值,将所述第一平均能量值确定为所述能量值阈值E0;
确定所述音频帧数M0为第一预设值。
可选地,根据检测的结果调节能量阈值E0和音频帧数M0包括:
在检测的结果为接收到唤醒所述家用电器的唤醒词的情况下,截取当前环境下语音中所述预定数量的音频帧数,其中,所述语音为接收到唤醒所述家用电器的唤醒词时刻至反馈唤醒所述家用电器的反馈消息时刻之间的语音;
计算所述预定数量的音频帧数的第二平均能量值,根据所述第二平均能量值更新所述能量阈值E0。
可选地,根据检测的结果调节能量阈值E0和音频帧数M0包括:
在检测的结果为接收到唤醒所述家用电器的唤醒词的情况下,调节所述能量阈值E0;
将所述音频帧数M0调节为第二预设值,其中,所述第二预设值小于所述第一预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811468244.7/2.html,转载请声明来源钻瓜专利网。