[发明专利]一种基于深度学习的废钢卸料变化区域自动识别方法在审
申请号: | 202111357651.2 | 申请日: | 2021-11-16 |
公开(公告)号: | CN114049543A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 来博文;贾永坡;安宝;彭晶;王伟;冯兴;杨冬靓 | 申请(专利权)人: | 河钢数字技术股份有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/74;G06V10/764;G06V20/10;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 王丽巧 |
地址: | 050000 河北省石家*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 废钢 卸料 变化 区域 自动识别 方法 | ||
1.一种基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述方法包括如下步骤:
S1:通过摄像头获取需检测的目标区域图像并传输给算法服务器;
S2:利用Mask R-CNN算法构建废钢车厢定位模型,将步骤S1获取的目标区域图像输入训练好的废钢车厢定位模型,识别出目标区域图像中废钢车厢位置,并提取废钢车厢区域像素范围;
S3:基于YOLO-v4算法构建废钢卸料抓斗追踪模型,利用训练好的废钢卸料抓斗追踪模型,在步骤S2提取的废钢车厢区域内追踪抓斗运行轨迹,当检测到抓斗离开废钢车厢区域时,以下降沿作为触发,从视频中抓拍抓斗抓取废钢后废钢车厢区域的多帧图像;
S4:利用高斯混合模型对背景建模,采用步骤S3中抓拍的上一次抓取后废钢车厢区域的多帧图像训练高斯混合模型,通过高斯混合模型与当前抓取后废钢车厢区域图像差分运算,识别出废钢抓斗抓取后废钢车厢变化区域,并保存面积最大的变化区域。
2.根据权利要求1所述的基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述步骤S2中,废钢车厢定位模型利用ResNet-FPN对目标区域图像进行多尺度特征提取,通过头部网络实现对废钢车厢位置像素级的识别。
3.根据权利要求1所述的基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述步骤S2中,所述废钢车厢定位模型的训练包括以下步骤:
S21:采集大规模废钢车图像数据和工业现场视频监控图像数据,对图像数据进行标注,制作训练集Vtrain、测试集Vtest和验证集Vval;
S22:利用优化函数求解模型中的参数,所述优化函数为TensorFlow中的adamoptimizer函数,模型输入图像尺寸为img=(512,512,3);
S23:对废钢车厢定位模型进行训练,当Loss值达到需求时停止训练:
Loss=Lcls+Lbox+Lmask
其中,Lcls为分类误差,Lbox为检测误差,Lmask为分割误差;
S24:对训练好的模型测试预测效果,若达到需求则保存模型,否则重复步骤S23过程继续训练。
4.根据权利要求1所述的基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述步骤S3中,废钢卸料抓斗追踪模型利用CSPdarknet53作为主干特征提取网络,结合SPP网络实现多尺度特征提取。
5.根据权利要求1所述的基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述步骤S3中,所述废钢卸料抓斗追踪模型的训练包括以下步骤:
S31:采集大规模废钢抓斗图像数据,包括抓取前、抓取中、抓取后三种状态,对图像数据进行标注,制作训练集Qtrain、测试集Qtest和验证集Qval;
S32:利用优化函数求解模型中的参数,所述优化函数为TensorFlow中的adamoptimizer函数,模型输入图像为img=(416,416,3);
S33:对废钢卸料抓斗追踪模型进行训练,当Loss值达到需求时停止训练:
Loss=Lcls+Lbox+Lcfd
其中,Lcls为分类误差,Lbox为检测误差,Lcfd为置信度误差;
S34:对训练好的模型测试预测效果,若达到需求则保存模型,否则重复步骤S33过程继续训练。
6.根据权利要求1所述的基于深度学习的废钢卸料变化区域自动识别方法,其特征在于,所述步骤S4中,所述高斯混合模型背景建模包括以下步骤:
S41:存储上一次抓取后废钢车厢区域k帧图像;
S42:高斯混合模型采用上一次抓取后废钢车厢区域k帧图像建模G,图像中位置为(x0,y0)的像素点在一段时间内的观测值为:
{X1,...,Xt}={I(x0,y0,i):1≤i≤t}
S43:利用多个高斯分布对上式中的观测值进行建模,得到当前像素点的颜色值概率为:
其中,K为高斯分布的个数,ωi,t为权重的估计值,即t时刻该像素点属于第i个高斯分布的可能性的大小,μi,t为t时刻第i个高斯分布的均值,∑i,t为第i个高斯分布的协方差矩阵,η为高斯分布概率密度函数;像素点颜色值的三个分量(R,G,B)相互独立,并且具有相同的方差,第i个高斯分布的协方差矩阵∑i,t为
S44:高斯混合模型与当前抓取后图像差分运算:对于输入图像中的像素点(x0,y0,t),将其颜色值与已存在的K个高斯分布相比较,判断其是否与已经存在的高斯分布相匹配,如匹配则该像素点为背景点,判断规则如下:
|(Xt-μi,t-1)|<TH×σi,t-1
其中,μi,t-1为第i个高斯分布在t-1时刻的均值,TH取2.5,σi,t-1为第i个高斯分布在t-1时刻的标准偏差。
S45:输入当前抓取后的废钢车厢区域图像到高斯混合模型G,识别当前抓取后废钢车厢变化区域,保存面积最大的变化区域:
Achange=max(S(A1),S(A2),...,S(An))。
其中,Achange为所求矩形变化区域的坐标,S(A1),S(A2),...,S(An)为每个变化区域的面积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河钢数字技术股份有限公司,未经河钢数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111357651.2/1.html,转载请声明来源钻瓜专利网。