[发明专利]一种基于图像处理的鸟鸣声特征强化方法在审
申请号: | 201910139801.9 | 申请日: | 2019-02-26 |
公开(公告)号: | CN109886214A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 杨春勇;祁宏达;侯金;陈少平 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 武汉宇晨专利事务所 42001 | 代理人: | 黄瑞棠 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鸟鸣声 图像处理 数据增强 频谱图 特征强化 信号谱图 自动识别 鸟类 分块 预处理 伪彩色处理 灰度图像 生物频谱 视觉感知 信号转换 学习方式 归一化 三通道 时频域 数据集 噪声谱 重采样 二维 时域 映射 迁移 学习 探索 | ||
1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:
①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;
②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;
③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;
④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:
⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;
⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。
2.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤②:
信号谱图的分离方法为:设定一个阈值N,如果频谱图中某个像素值高于相应行及其相应列的中值的N倍,则将其置为1,否则置为0;
噪声谱图的分离方法为:设定一个阈值n(n<N),如果某个像素值高于相应行及其相应列的中值的n倍,则将其置为0,否则置为1。
3.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤④:
包括频域变换、噪声添加和同类样本混合;
A、频域变换
a、对原始鸟鸣声音频的音高进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
b、对原始鸟鸣声音频的音量进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
B、噪声添加
a、将随机高斯噪声添加到步骤②中的信号谱图,并重新标准化得到的图像;
b、将步骤②中的噪声部分随机添加到步骤②中的信号谱图,作为训练样本;
C、同类样本混合
对同一种鸟的不同音频信噪分离后的信号谱图进行随机混合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910139801.9/1.html,转载请声明来源钻瓜专利网。