[发明专利]一种基于大规模养殖场厂哺乳动物异常声音监测方法有效
申请号: | 201811589296.X | 申请日: | 2018-12-25 |
公开(公告)号: | CN109599120B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 苍岩;王文静;乔玉龙;陈春雨;何恒翔;熊梓奥 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L21/0208;G10L25/18;G10L25/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 大规模 养殖场 哺乳动物 异常 声音 监测 方法 | ||
本发明公开了一种基于大规模养殖场厂哺乳动物异常声音监测方法,属于声音识别领域,具体涉及一种无监督的声音识别方法。本发明主要包括以下几个部分:1.谱图分析:对采集来的音频进行分析,确定声音识别方案的可行性;2.音频降噪:对音频降噪处理,提高声音识别的准确性;3.无监督音频分割:简化音频处理过程,无需手动切分得到包含所需声音事件的音频段;4.音频特征提取:采用的特征提取技术为Mel频率倒谱系数;5.无监督分类:采用无监督分类方法为K均值算法。本发明通过采用无监督的音频分割技术和K均值的分类方法,结合频谱、时频谱分析技术,音频降噪技术,Mel频率倒谱系数特征提取技术,实现了对大规模养殖场动物无监督的声音识别。
技术领域
本发明属于声音识别领域,具体涉及一种无监督的声音识别方法。
背景技术
声音识别技术应用广泛,在公共安全、医疗、智能养殖等各个领域都有研究。现有的技术中,声音识别技术多采用监督学习的方式,需要手动参与音频的分割和标注,声音处理和识别的过程较复杂,成本较高。2015年福州大学发明了一种基于声谱图双特征的动物声音识别方法(CN104882144A)通过建立声音样本库,对将预存声音样本及待识别的声音信号转化成声谱图,将声谱图进行规范化,并进行特征值分解和投影,以声音样本库中预存声音样本对应的双层特征集为训练样本集,以待识别的声音信号对应的双层特征为输入样本,通过随机森林的训练,得出待识别的声音信号于声音样本库中对应的类别并输出结果。此方法采用监督学习的方式实现声音识别,需手工标注大量数据,且实现过程复杂。2016年浙江大华技术有限公司发明了一种典型异常声音检测方法(CN105810213A)通过对采集到的声音进行预处理,获取有效信号片段的声谱图并根据声谱图确定待测试识别特征矩阵,用于表示声音信号在时频域上的声音强度分布情况,计算待测试识别特征矩阵与异常声音模型库中的各标准识别特征矩阵的相似度,根据计算结果确定所述有效信号片段中的异常声音类型。该方法用有监督的方式对音频进行预处理,且仅用声谱图的声音强度分布信息,很难实现高精度。2017年杭州华为数字技术有限公司发明了一种异常声音的分类方法和装置(CN106683687A)该方法通过对异常声音信号进行分帧处理,之后对每帧信号进行滤波处理,得到该异常声音信号的能量特征信息。根据该异常声音信号的能量特征信息,设置相应的阈值,进而确定该异常声音信号的分类结果。此方法需用监督学习的方式根据异常帧的能量设置阈值,阈值设置对分类准确度影响很大,且操作较为复杂,无法实现简便可靠识别的目的。
基于此,有必要提出一种简便实用的无监督的声音识别方法,能够自动的对音频分割且无需手工标注。
发明内容
本发明提供了一种基于大规模养殖场厂哺乳动物异常声音监测方法,目的在于提出一种简便实用的无监督的声音识别方法,能够自动的对音频分割且无需手工标注。
本发明主要包括以下几个部分:
步骤一、谱图分析:对采集来的音频进行频谱、时频谱分析,以确定声音识别方案的可行性。
步骤二、音频降噪:对音频降噪处理,除去背景噪声,可提高声音识别的准确性。
步骤三、无监督音频分割:简化音频处理过程,无需手动切分即可得到包含所需声音事件的音频段。
步骤四、音频特征提取:本发明对音频采用的特征提取技术为Mel频率倒谱系数。
步骤五、无监督分类:本发明采用的无监督分类方法为K均值算法。
本发明还进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811589296.X/2.html,转载请声明来源钻瓜专利网。