[发明专利]一种基于图像处理的鸟鸣声特征强化方法在审
申请号: | 201910139801.9 | 申请日: | 2019-02-26 |
公开(公告)号: | CN109886214A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 杨春勇;祁宏达;侯金;陈少平 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 武汉宇晨专利事务所 42001 | 代理人: | 黄瑞棠 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于图像处理的鸟鸣声特征强化方法,涉及图像处理、深度学习和鸟类识别技术。本方法是:①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;②对频谱图进行信噪分离,得到信号谱图和噪声谱图;③对所有频谱图进行分块;④对分块后的信号谱图进行数据增强:⑤通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像;⑥通过迁移学习方式,得到识别结果。本发明的有益效果是:①用于高效地进行鸟类自动识别;②通过将一维时域的鸟鸣声信号转换为二维时频域的生物频谱信息;③图像处理包括:鸟鸣声信噪分离、特异性数据增强和视觉感知力增强,为深度学习在鸟类自动识别领域的探索更进一步。 | ||
搜索关键词: | 鸟鸣声 图像处理 数据增强 频谱图 特征强化 信号谱图 自动识别 鸟类 分块 预处理 伪彩色处理 灰度图像 生物频谱 视觉感知 信号转换 学习方式 归一化 三通道 时频域 数据集 噪声谱 重采样 二维 时域 映射 迁移 学习 探索 | ||
【主权项】:
1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910139801.9/,转载请声明来源钻瓜专利网。