[发明专利]一种用于实时定位辨识动物舍内异常声音的方法及系统在审
申请号: | 201810111942.5 | 申请日: | 2018-02-05 |
公开(公告)号: | CN108198562A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 滕光辉;杜晓冬;周振宇;李志忠 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/18;G10L17/04;G01S5/20 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 徐宁;孙楠 |
地址: | 100193 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常声音 发声 动物舍 辨识 实时声音数据 来源方向 实时定位 发声位置 非侵入式 连续监测 人力物力 声音系统 饲养管理 音频文件 准确率 检测 存储 监测 养殖 | ||
1.一种用于实时定位辨识动物舍内异常声音的方法,其特征在于包括以下步骤:
1)获取实时声音数据;
2)根据获取的实时声音数据检测是否有动物异常声音;
3)当检测到有动物异常声音时,定位该异常声音来源方向;
4)在异常声音来源方向,定位发声动物的精确位置;
5)标记的动物异常声音和发声位置,存储成历史音频文件形式。
2.如权利要求1所述方法,其特征在于:所述实时声音数据采用分布式麦克风阵列进行获取;所述分布式麦克风阵列采用平面矩形结构或多平面立体结构。
3.如权利要求1所述方法,其特征在于:所述步骤2)中,根据实时声音数据检测动物异常声音的方法包括以下步骤:
2.1)将获取的实时声音信号转化为音频数据;
2.2)判断音频数据中的声压是否高于预先设定的声压阈值,高于则进入下一步,反之则忽略不计;
2.3)在声压高于阈值声压时,判断音频数据中在400Hz~2500Hz频率范围内是否存在单峰值或多峰值特征,存在则进入下一步,反之则忽略不计;
2.4)当出现单峰值或多峰值特征时,利用神经网络音色模型对音频数据进行识别,判断其声音类型为鸣叫声、饮水声、产蛋叫声、采食声、机械噪声或其它声音;
2.5)当判断结果为其它声音时,将该音频标记为异常声音。
4.如权利要求3所述方法,其特征在于:所述步骤2.4)中,神经网络音色模型的建立过程包括以下步骤:
2.4.1)对单峰值或多峰值特征的音频信号进行特征提取:提取的特征为MFCC和TF特征的组合特征;MFCC为梅尔频率倒谱系数,TF为三色共振峰;
MFCC的计算步骤为:
(1)预加重:采用有限脉冲响应滤波器处理音频信号;
(2)对预加重处理后的音频信号进行分帧;
(3)对分帧后的音频信号进行离散傅里叶变换及分割:每一帧经过离散傅里叶变换后,再采用三角形滤波器组成的滤波器组进行分割;
(4)对分割后的音频信号进行离散余弦变换,选取12维静态特征向量作为特征参数的输入;
2.4.2)选取反向传播神经网络作为分类器,对组合特征进行分类识别。
5.如权利要求3所述方法,其特征在于:所述TF特征是依据动物发声机制进行提取,提取动物前三个主要共振峰特征,获取其三色共振峰特征TFi:
式中,Fi表示不同共振峰,i=1,2,3;选取TF的3维特征向量作为特征参数的输入。
6.如权利要求5所述方法,其特征在于:所述三个主要共振峰是指峰值最大的三个共振峰,其中第一共振峰的峰值最大;第二共振峰的峰值小于第一共振峰,频率高于第一共振峰;第三共振峰的峰值小于第二共振峰,频率高于第二共振峰。
7.如权利要求1所述方法,其特征在于:所述步骤3)中,异常声音来源方向的定位是采用对声源区域利用基于最大声能量算法进行定位计算;所述步骤4)中,动物发声的精确位置定位是采用基于SRP-PHAT算法或可控功率响应算法进行声源精准定位计算。
8.如权利要求7所述方法,其特征在于:所述基于SRP-PHAT算法进行声源精准定位计算的步骤如下:
4.1)假设动物发声点位于每个单元内,则根据各单元的几何位置关系估计出动物声音到达各个分布式麦克风的时间差;
4.2)将各麦克风采集的音频波形进行时间延迟补偿,进而计算出广义互相关GCC的值,GCC为声源定位算法;
4.3)将多对通道GCC进行累加计算,得到各个区域块累计之后的声功率值,声功率值最大的区域块位置为真实声源的估计位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810111942.5/1.html,转载请声明来源钻瓜专利网。