[发明专利]基于卷积神经网络的可可西里藏羚羊检测方法在审
申请号: | 201810193118.9 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108509860A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 卢朝阳;翟俊伟;裴竟德;李静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络的可可西里藏羚羊检测方法,主要解决现有技术对藏羚羊种群统计速度慢且不精确的问题。其实现方案是:1)构建训练数据集,对采集及数据增强得到的藏羚羊图像进行标注,得到训练数据集;2)利用k‑means算法对训练数据集进行目标框维度聚类,得到藏羚羊数据集的最有效的先验框信息,构建一个具有19个卷积层和5个最大池化层的卷积神经网络;3)用卷积神经网络对藏羚羊图像数据进行训练,得到藏羚羊检测与分类模型;4)利用训练好的模型,对藏羚羊图像进行检测,画出藏羚羊具体位置并标注所属类别。本发明能更快更准确的对藏羚羊进行检测与分类,可用于对自然保护区中藏羚羊的科学保护与管理。 | ||
搜索关键词: | 藏羚羊 卷积神经网络 训练数据集 检测 构建 标注 图像 先验 分类模型 数据增强 图像数据 框信息 目标框 数据集 池化 聚类 卷积 可用 维度 算法 种群 采集 分类 统计 管理 | ||
【主权项】:
1.基于卷积神经网络的可可西里藏羚羊检测方法,包括:(1)构建训练数据集:(1a)采集若干个不同场景中的可可西里藏羚羊图片数据;(1b)对图片数据进行增强处理,以获得更多的训练样本量;(1c)利用图像标注工具LabelImg对上述采集到的以及数据增强后的藏羚羊图像进行目标框标注,并将标注藏羚羊的坐标、宽高以及类别信息存入到xml格式的标签文件中,每一幅标注图像对应一个xml文件;(1d)提取xml文件中的藏羚羊坐标、宽高以及类别信息并存到txt格式的标签文件中,构成训练数据集;(2)以GoogLetNet为基础网络,使用1*1和3*3的卷积核,构建一个包含19个卷积层和5个最大值池化层的卷积神经网络;(3)目标框维度聚类:(3a)通过k‑means聚类算法对(1d)中所生成的训练数据集进行聚类,获取藏羚羊数据集的最优先验框个数k与各个先验框的宽w和高h;(3b)根据(2)中构建的卷积神经网络的降采样倍率,将(3a)得到的先验框的宽和高转换为相对于卷积神经网络最后网格的比例大小;(4)利用卷积神经网络中的损失函数对藏羚羊图像数据进行训练,得到藏羚羊检测与分类模型;(5)利用(2)中构建的卷积神经网络以及(4)中训练好的模型对待检测图像中的藏羚羊目标进行检测并分类:(5a)对于每一幅待检测图像,通过卷积神经网络得到S*S*K个预测框,每个预测框预测C个类别,取值为2,最终得到一个C*(S*S*K)大小的二维分数矩阵,其中S代表划分的网格数,K表示(3a)聚类得到的先验框个数;(5b)对分数矩阵的每一行,将得分小于阈值δ的分数设置为0,并将得分从高到低排序;(5c)根据上述得到的分数矩阵,利用非极大值抑制方法去掉重叠率较大的预测框;(5d)针对每个预测框的2个分数,取较大的一个,对其进行判断:如果该分数值大于0,则保留该预测框,并将该预测框的类别设置为该分数对应的藏羚羊类别;如果该值小于等于0,说明该预测框里面没有藏羚羊目标,则舍弃该预测框;(5e)将所有保留的预测框映射到原图像中,并根据预测框类别,用不同颜色在原图中画出预测框并标出藏羚羊所属类别;(5f)根据预测框个数及类别,统计出整幅图像中所有藏羚羊的数量以及每一类藏羚羊的数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810193118.9/,转载请声明来源钻瓜专利网。