[发明专利]一种语音活动性检测方法、设备及计算机可读存储介质有效
申请号: | 201910977031.5 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110556128B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 付聪;李勤 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/78;G10L25/87;G10L21/0216 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 活动性 检测 方法 设备 计算机 可读 存储 介质 | ||
1.一种语音活动性检测方法,其特征在于,所述方法包括:
获取声音信号;
对所述声音信号进行信号能量估计,得到所述声音信号的能量估计值;
判断所述声音信号的能量估计值是否超出能量阈值,得到判断结果;能量阈值为用于区分声音信号是噪声或非噪声的临界值;
当所述判断结果为所述声音信号的能量估计值未超出能量阈值时,对所述声音信号进行语音活动性检测,得到语音活动性检测结果;
当所述判断结果为所述声音信号的能量估计值超出能量阈值时,对所述声音信号进行降噪处理,获得降噪后的声音信号;
对所述降噪后的声音信号进行语音活动性检测。
2.根据权利要求1所述的方法,其特征在于,对所述声音信号进行信号能量估计,得到所述声音信号的能量估计值,包括:
对所述声音信号进行噪声估计,得到噪声估计结果;
基于时间窗口对所述噪声估计结果进行处理,得到噪声估计均方值;
确定所述噪声估计方值为能量估计值。
3.根据权利要求1所述的方法,其特征在于,对所述声音信号进行语音活动性检测,包括:
确定所述声音信号的能量或信噪比;
基于所述声音信号的能量或信噪比进行语音活动性检测。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所得到的语音活动性检测结果为所述声音信号包含语音信号时,将所述声音信号作为后处理模块的输入信号;
当所得到的语音活动性检测结果为所述声音信号不包含语音信号时,直接将所述声音信号丢弃。
5.一种语音活动性检测设备,其特征在于,所述设备包括:
获取模块,用于获取声音信号;
估计模块,用于对所述声音信号进行信号能量估计,得到所述声音信号的能量估计值;
判断模块,用于判断所述声音信号的能量估计值是否超出能量阈值,得到判断结果;能量阈值为用于区分声音信号是噪声或非噪声的临界值;
检测模块,用于当所述判断结果为所述声音信号的能量估计值未超出能量阈值时,对所述声音信号进行语音活动性检测,得到语音活动性检测结果;
所述设备还包括:
降噪模块,用于当所述判断结果为所述声音信号的能量估计值超出能量阈值时,对所述声音信号进行降噪处理,获得降噪后的声音信号;
所述检测模块,还用于对所述降噪后的声音信号进行语音活动性检测。
6.根据权利要求5所述的设备,其特征在于,所述估计模块,包括:
噪声估计子模块,用于对所述声音信号进行噪声估计,得到噪声估计结果;
处理子模块,用于基于时间窗口对所述噪声估计结果进行处理,得到噪声估计均方值;
第一确定子模块,用于确定所述噪声估计方值为能量估计值。
7.根据权利要求5所述的设备,其特征在于,所述检测模块,包括:
第二确定子模块,用于确定所述声音信号的能量或信噪比;
检测子模块,用于基于所述声音信号的能量或信噪比进行语音活动性检测。
8.一种计算机可读存储介质,其特征在于,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行权利要求1-4任一项所述的语音活动性检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910977031.5/1.html,转载请声明来源钻瓜专利网。