[发明专利]一种基于图像处理的鸟鸣声特征强化方法在审

专利信息
申请号: 201910139801.9 申请日: 2019-02-26
公开(公告)号: CN109886214A 公开(公告)日: 2019-06-14
发明(设计)人: 杨春勇;祁宏达;侯金;陈少平 申请(专利权)人: 中南民族大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 武汉宇晨专利事务所 42001 代理人: 黄瑞棠
地址: 430074 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 鸟鸣声 图像处理 数据增强 频谱图 特征强化 信号谱图 自动识别 鸟类 分块 预处理 伪彩色处理 灰度图像 生物频谱 视觉感知 信号转换 学习方式 归一化 三通道 时频域 数据集 噪声谱 重采样 二维 时域 映射 迁移 学习 探索
【权利要求书】:

1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:

①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;

②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;

③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;

④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:

⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;

⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。

2.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤②:

信号谱图的分离方法为:设定一个阈值N,如果频谱图中某个像素值高于相应行及其相应列的中值的N倍,则将其置为1,否则置为0;

噪声谱图的分离方法为:设定一个阈值n(n<N),如果某个像素值高于相应行及其相应列的中值的n倍,则将其置为0,否则置为1。

3.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤④:

包括频域变换、噪声添加和同类样本混合;

A、频域变换

a、对原始鸟鸣声音频的音高进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;

b、对原始鸟鸣声音频的音量进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;

B、噪声添加

a、将随机高斯噪声添加到步骤②中的信号谱图,并重新标准化得到的图像;

b、将步骤②中的噪声部分随机添加到步骤②中的信号谱图,作为训练样本;

C、同类样本混合

对同一种鸟的不同音频信噪分离后的信号谱图进行随机混合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910139801.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top