[发明专利]工业环境下基于改进的YOLO-6D算法的目标检测方法有效
申请号: | 202010330520.4 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111626120B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 吴益飞;丛宇;郭健;陈庆伟;靳懿;吴鑫煜 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/764;G06N3/0464;G06N3/048;G06N3/082;G06N3/047 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 朱炳斐 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工业 环境 基于 改进 yolo 算法 目标 检测 方法 | ||
1.工业环境下基于改进的YOLO-6D算法的目标检测方法,其特征在于,所述方法包括以下步骤:
采集包含待检测目标的若干图像;
构建YOLO-6D网络的训练数据集;
对YOLO-6D网络进行改进,包括:利用ResNet-53代替ResNet-19的深度残差神经网络;将回归函数以及激活函数中的Softmax替换为Sigmoid;
利用所述训练数据集对YOLO-6D网络进行训练,获得目标检测模型;
进行坐标偏移,保证目标处于图像划分后的一个小格子cell中,所述坐标偏移公式为:
gx=f(x)+cx
gy=f(y)+cy
式中,gx、gy分别表示x,y方向的偏移量,cx,cy表示划分的小格子cell的坐标;针对目标物体的中心点,函数f(·)表示Sigmoid函数,针对目标物体的八个角点,函数f(·)则表示恒等函数;
利用所述目标检测模型对工业环境中的待检测目标进行检测,获取目标的空间信息和分类信息;其中,获取目标的分类信息,具体包括:
获取目标分别在ResNet-53三个尺度输出图像中所属分类的概率;
利用所述回归函数对所述概率进行多标签分类,获得目标的分类信息。
2.根据权利要求1所述的工业环境下基于改进的YOLO-6D算法的目标检测方法,其特征在于,所述训练数据集包括:所述包含待检测目标的若干图像和自定义添加的若干噪声图像,以及每一幅图像对应的标注信息,所述标注信息包括:图像中是否包含待检测目标、待检测目标的空间信息和分类信息。
3.根据权利要求1所述的工业环境下基于改进的YOLO-6D算法的目标检测方法,其特征在于,所述ResNet-53包括三个输出:32倍降采样后的特征图作为第一输出,对32倍降采样后的特征图进行步长为2的上采样,获得的16倍降采样后的特征图作为第二输出,对16倍降采样后的特征进行步长为2的上采样,获得的8倍降采样后的特征作为第三输出。
4.根据权利要求1所述的工业环境下基于改进的YOLO-6D算法的目标检测方法,其特征在于,所述对YOLO-6D网络进行训练的过程中,所采用的置信度函数为:
式中,DT(x)为预测的平面图片2D点的坐标值与3D空间中的实际值之间的欧式距离,dth为预设的阈值,α为超参,取值范围为0.1~10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010330520.4/1.html,转载请声明来源钻瓜专利网。