[发明专利]啸叫检测方法及装置、介质和计算设备在审

申请号：	202111347480.5	申请日：	2021-11-15
公开（公告）号：	CN114067837A	公开（公告）日：	2022-02-18
发明（设计）人：	陈志鹏;阮良;陈功;陈丽;陈耀斌	申请（专利权）人：	杭州网易智企科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/30
代理公司：	北京律智知识产权代理有限公司 11438	代理人：	王辉;阚梓瑄
地址：	310052 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	检测方法装置介质计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种啸叫检测方法，其特征在于，包括：

获取待检测音频信号，并对所述待检测音频信号进行预处理以获得待检测音频特征数据；

通过目标啸叫检测模型基于所述待检测音频特征数据获取检测结果；所述检测结果至少包含啸叫属性信息；

其中，通过第一啸叫检测模型基于在不同通信场景下采集的样本音频信号以及对应的啸叫标注信息的训练获得所述目标啸叫检测模型；所述第一啸叫检测模型包含依次级联的卷积神经网络和循环神经网络。

2.根据权利要求1所述的啸叫检测方法，其特征在于，所述对所述待检测音频信号进行预处理以获得待检测音频特征数据，包括：

将所述待检测音频信号进行重采样，以使所述待检测音频信号归一化到指定采样率；

对归一化后的待检测音频信号进行分帧处理；

对分帧后的一帧待检测音频信号进行特征提取以获得待检测音频特征数据。

3.根据权利要求1所述的啸叫检测方法，其特征在于，所述第一啸叫检测模型的训练，包括：

基于所述卷积神经网络，对所述样本音频信号的特征数据进行卷积处理，输出第一特征向量，所述第一特征向量中包含有时序信息；

基于所述循环神经网络，对所述第一特征向量进行时序特征学习，输出第二特征向量；

对所述第二特征向量进行聚焦处理，输出啸叫属性概率分布向量，所述啸叫属性概率分布向量表示各啸叫属性对应的概率；

基于所述样本音频信号的特征数据对应啸叫属性的概率和所述啸叫标注信息，采用损失函数确定目标损失信息；

根据所述目标损失信息，对所述第一啸叫检测模型的参数进行调整。

4.根据权利要求3所述的啸叫检测方法，其特征在于，所述第一啸叫检测模型的训练，还包括：

基于指定衡量标准对所述第一啸叫检测模型中的神经元及其连接关系进行裁剪；和/或

基于指定量化准则对所述第一啸叫检测模型的参数进行量化。

5.根据权利要求1所述的啸叫检测方法，其特征在于，所述啸叫标注信息包括是否含啸叫、啸叫类型信息和啸叫级别信息中的一种或多种。

6.根据权利要求3所述的啸叫检测方法，其特征在于，所述基于所述样本音频信号的特征数据对应啸叫属性的概率和所述啸叫标注信息，采用损失函数确定目标损失信息的步骤至少包括以下之一：

当所述啸叫标注信息包括是否含啸叫时，采用加权二值交叉熵损失函数确定目标损失信息；

当所述啸叫标注信息包含是否含啸叫和啸叫类型信息时，采用二分类的加权二值交叉熵损失函数确定是否含啸叫对应的第一损失信息以及采用多分类对应的第一损失函数确定啸叫类型信息对应的第二损失信息，并基于所述第一损失信息和第二损失信息得到所述目标损失信息；

当所述啸叫标注信息包含是否含啸叫和啸叫级别信息时，采用二分类的加权二值交叉熵损失函数确定是否含啸叫对应的第一损失信息以及采用多分类对应的第二损失函数确定啸叫级别信息对应的第三损失信息，并基于所述第一损失信息和第三损失信息得到所述目标损失信息；

当所述啸叫标注信息包含是否含啸叫、啸叫类型信息和啸叫级别信息时，采用二分类的加权二值交叉熵损失函数确定是否含啸叫对应的第一损失信息，采用多分类对应的第一损失函数确定啸叫类型对应的第二损失信息，以及采用多分类对应的第二损失函数确定啸叫级别信息对应的第三损失信息，并基于所述第一损失信息、第二损失信息和第三损失信息得到所述目标损失信息。

7.根据权利要求3所述的啸叫检测方法，其特征在于，所述基于所述卷积神经网络，对所述样本音频信号的特征数据进行卷积处理，输出第一特征向量，包括：

针对不同啸叫类型，对所述卷积神经网络的卷积层参数进行丢弃处理，以使目标啸叫检测模型适用于不同啸叫类型的检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司，未经杭州网易智企科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111347480.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种氧传感器的加热控制方法、装置、设备及介质
下一篇：一种自动圆盘印花机链传动装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]啸叫检测方法及装置、介质和计算设备在审

专利文献下载