[发明专利]一种基于自动标注和迁移学习的密集堆垛目标检测方法有效

专利信息
申请号: 201911074733.9 申请日: 2019-11-06
公开(公告)号: CN110866476B 公开(公告)日: 2023-09-01
发明(设计)人: 郁云 申请(专利权)人: 南京信息职业技术学院
主分类号: G06V20/10 分类号: G06V20/10;G06V10/762;G06V10/764;G06V10/82;G06N3/0464;G06N3/096
代理公司: 南京天翼专利代理有限责任公司 32112 代理人: 奚铭
地址: 210023 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 自动 标注 迁移 学习 密集 堆垛 目标 检测 方法
【说明书】:

一种基于自动标注和迁移学习的密集堆垛目标检测方法,由高分辨率图像分割建立已标注的训练图像集;然后将已标注的训练图像集输入已预训练的目标检测模型YOLOv3,优化YOLOv3模型的先验框尺寸和损失函数,利用训练图像集对模型进行精调;最后将待检测图像输入精调后的YOLOv3模型,输出目标子区域的分类和子区域位置,再将输出结果图拼接恢复成原始图像,并统计总计数结果。本发明方法具有很强的抗干扰性和鲁棒性,对图像拍摄者和拍摄光照条件的要求较低;通过无监督学习方法,实现了图像的准自动标注,极大降低了人工标注的工作量,提高了模型训练效率;能用于包含大量相互遮挡的密集堆垛目标的图像识别,适合各种密集堆垛目标自动计数的场景。

技术领域

本发明属于机器视觉技术领域,涉及目标检测方法,尤其是一种基于自动标注和迁移学习的密集堆垛目标检测方法。

背景技术

建筑行业实践中会涉及到对钢材、木材等规格化物体堆垛的计数问题。堆垛的目标对象规模通常在几百到上千根不等,整个人工计数过程耗时长、效率低、易出错。建筑用材料堆垛中的目标对象数量虽然庞大,但是由于规格化程度高,个体之间形状尺寸等差异较小,有利于研究通过机器视觉领域中的目标检测技术,对密集堆垛中的个体进行自动检测并计数。研究成果可以减轻计数工人的劳动强度,提高计数效率。

传统的基于机器视觉的目标检测方法,主要是针对特定形状物体进行形状检测,然后结合基于阈值的轮廓提取和形态学重构的图像分割实现对物体的检测定位。对于存在目标个体对象变形、目标个体间相互遮挡、以及杂乱背景等因素影响的密集堆垛目标的检测,该类方法精度急剧下降,无法满足工程应用的需要。同时,该类方法在复杂光照条件下,无法区分目标对象阴影与堆垛间隙;并且随着堆垛中待识别个体的数量增多,单个钢管所包含有效像素点变少,导致复杂背景与待识别目标之间的轮廓特征差异性降低,对子区域的阈值的设定变得困难,最终导致目标识别精度的快速下降。

通过对以上算法存在的问题以及解决方法的研究,结合工程应用的实际需求,需要研究计算结果更加精确,满足工业应用需要的新方法。基于深度卷积神经网络方法的新一代目标检测方法近年来在各个产业领域得到广泛的研究和应用,也为解决上述问题提供了新的思路。然而在应用实践中,现有的基于深度卷积神经网络的目标检测方法同样存在对输入图像的尺寸、目标个体像素存在较严格的要求,以及用于有监督学习训练的输入图像严重依赖人工标注等问题。因此为了实现利用深度学习技术对密集堆垛目标进行准确检测定位,需要解决该技术存在的上述缺陷。

发明内容

本发明要解决的技术问题是:现有的密集堆垛目标检测方法对图像质量、亮度、拍摄角度、遮挡等要求高,检测的精确性,实用性不高的问题。而基于深度学习技术的目标检测方法存在严重依赖事前人工标注的准确性,对输入图像的尺寸和像素密度有严格要求等问题,同样影响其实用性和鲁棒性。

本发明的技术方案为:一种基于自动标注和迁移学习的密集堆垛目标检测方法,是对于截面堆垛图像,将高分辨率图像分割为多个低分辨率图像,将低分辨率图像分成N个子区域,记录子区域在原图像位置,使用变分自编码器VAE模型对图像进行分类和标注,得到已标注的训练图像集;然后将已标注的训练图像集输入已预训练的目标检测模型YOLOv3,优化YOLOv3模型的先验框尺寸和损失函数,利用训练图像集对模型进行精调;最后将待检测图像输入YOLOv3模型,输出目标子区域的分类和子区域位置及数量,再将输出结果图拼接恢复成原始高分辨率图像,并统计总计数结果,完成堆垛物计数。

作为优选方式,本发明包括如下步骤:

步骤1,利用滑窗算法将高分辨率的堆垛横截面图像分割成低分辨率图像;然后将低分辨率图像分成M个R0×R0像素的子区域集,并记录每个子区域的中心点位置数据;利用变分自编码器模型,对每个图像的目标子区域与非目标子区域进行分类,目标子区域指堆垛物体的截面,其他为非目标子区域,最后结合子区域的中心点位置数据实现对目标子区域的自动标注;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息职业技术学院,未经南京信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911074733.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top