[发明专利]语音活性检测方法、相关装置和设备有效
申请号: | 201711178373.8 | 申请日: | 2017-11-22 |
公开(公告)号: | CN107731223B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 刘继忠 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/78 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音活性检测方法,包括:接收语音数据;语音数据包括多帧语音信号;计算一帧语音信号的能量以及谱熵;将语音信号的能量开根号,或者将语音信号的谱熵开根号;并根据开根号后的能量或者开根号后的谱熵,计算语音信号的谱熵能量根;在语音信号的谱熵能量根小于第一预设阈值的情况下,判断出语音信号为非语音帧;或者在语音信号的谱熵能量根不小于第一预设阈值的情况下,判断出语音信号为语音帧本发明还公开了一种语音活性检测装置和语音活性检测设备,解决了现有技术基于短时能量和谱熵的方案阀值设置受录音环境影响大,或基于谱熵能量积的方案不能有效的反应语音帧的特性,造成不能准确检测语音段的技术问题。 | ||
搜索关键词: | 语音 活性 检测 方法 相关 装置 设备 | ||
【主权项】:
一种语音活性检测方法,其特征在于,包括:接收语音数据;所述语音数据包括多帧语音信号;计算一帧语音信号的能量以及谱熵;将所述语音信号的能量开根号,或者将所述语音信号的谱熵开根号;并根据开根号后的能量或者开根号后的谱熵,计算所述语音信号的谱熵能量根;在所述语音信号的谱熵能量根小于第一预设阈值的情况下,判断出所述语音信号为非语音帧;或者在所述语音信号的谱熵能量根不小于第一预设阈值的情况下,判断出所述语音信号为语音帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711178373.8/,转载请声明来源钻瓜专利网。