[发明专利]声音检测方法及装置有效

申请号：	201911398710.3	申请日：	2019-12-30
公开（公告）号：	CN111128227B	公开（公告）日：	2022-06-17
发明（设计）人：	李强	申请（专利权）人：	云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/78
代理公司：	北京冠和权律师事务所 11399	代理人：	张楠楠
地址：	100000 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种声音检测方法，其特征在于，包括：

提取待检测音频的音频帧的音频特征；

基于所述音频帧的音频特征，确定所述音频帧属于预设声音的后验概率；

根据所述音频帧的预设权重以及所述音频帧属于预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音；

所述提取待检测音频的音频帧的音频特征，包括：

提取所述待检测音频中的T个音频帧的音频特征，获得T帧特征；

所述基于所述音频帧的音频特征，确定所述音频帧属于预设声音的后验概率，包括：

基于所述T帧特征，确定所述待检测音频属于预设声音的后验概率；

所述基于所述T帧特征，确定所述待检测音频属于预设声音的后验概率，包括：

确定所述T帧特征中每帧特征对应的音频帧属于所述预设声音的后验概率；

所述根据所述音频帧的预设权重以及所述音频帧属于预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音，包括：

确定所述T帧特征中每帧特征对应的音频帧的预设权重；

根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音；

所述根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音，包括：

根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，确定所述待检测音频中存在所述预设声音的当前置信度；

当所述当前置信度不小于预设置信度时，确定所述待检测音频中存在所述预设声音；

当所述当前置信度小于预设置信度时，确定所述待检测音频中不存在所述预设声音；

所述确定所述T帧特征中每帧特征对应的音频帧的预设权重，包括：

通过以下第一公式确定所述每帧特征对应的音频帧的预设权重α_t：

其中：e_t＝v^Tf(Wα_t+b)+k，α_t为第t个音频帧的预设权重；v、W、b、k是预设参数，都设置有一个初始值，在神经网络学习过程中不断更新；f(.)是Relu激活函数；e_t中的参数为通过神经网络训练得到的；

所述根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，确定所述待检测音频中存在所述预设声音的当前置信度，包括：

通过以下第二公式确定所述待检测音频中存在所述预设声音的当前置信度

p_t为第t个音频帧属于所述预设声音的后验概率。

2.一种声音检测装置，其特征在于，包括：

提取模块，用于提取待检测音频的音频帧的音频特征；

确定模块，用于基于所述音频帧的音频特征，确定所述音频帧属于预设声音的后验概率；

检测模块，用于根据所述音频帧的预设权重以及所述音频帧属于预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音；

所述提取模块包括：

提取子模块，用于提取所述待检测音频中的T个音频帧的音频特征，获得T帧特征；

所述确定模块包括：

第一确定子模块，用于基于所述T帧特征，确定所述待检测音频属于预设声音的后验概率；

所述第一确定子模块包括：

确定单元，用于确定所述T帧特征中每帧特征对应的音频帧属于所述预设声音的后验概率；

所述检测模块包括：

第二确定子模块，用于确定所述T帧特征中每帧特征对应的音频帧的预设权重；

检测子模块，用于根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，检测所述待检测音频中是否存在所述预设声音；

所述检测子模块包括：

第一确定单元，用于根据所述每帧特征对应的音频帧的预设权重以及所述每帧特征对应的音频帧属于所述预设声音的后验概率，确定所述待检测音频中存在所述预设声音的当前置信度；

第二确定单元，用于当所述当前置信度不小于预设置信度时，确定所述待检测音频中存在所述预设声音；

第三确定单元，用于当所述当前置信度小于预设置信度时，确定所述待检测音频中不存在所述预设声音；

所述第二确定子模块包括：

第四确定单元，用于通过以下第一公式确定所述每帧特征对应的音频帧的预设权重α_t：

其中：e_t＝v^Tf(Wα_t+b)+k，α_t为第t个音频帧的预设权重；v、W、b、k是预设参数，都设置有一个初始值，在神经网络学习过程中不断更新；f(.)是Relu激活函数；e_t中的参数为通过神经网络训练得到；

所述检测子模块包括：

第五确定单元，用于通过以下第二公式确定所述待检测音频中存在所述预设声音的当前置信度

p_t为第t个音频帧属于所述预设声音的后验概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司，未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911398710.3/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音检测方法及装置有效

专利文献下载