[发明专利]复杂背景下的大钟料罐容器移动目标视觉定位与动态跟踪方法有效
申请号: | 201910988849.7 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110766726B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 欧阳奇;曹晨光;王媛媛;张涛;李乐;张建;韩林 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06T7/277 | 分类号: | G06T7/277;G06T7/00;G06F17/11;G06F17/13;G06F17/16;G06V10/774;G06V10/762 |
代理公司: | 重庆为信知识产权代理事务所(普通合伙) 50216 | 代理人: | 王海荣 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 背景 大钟 容器 移动 目标 视觉 定位 动态 跟踪 方法 | ||
1.一种复杂背景下的大钟料罐容器移动目标视觉定位与动态跟踪方法,其特征在于包括以下步骤:
S1:采用摄像设备,正对料罐筒口,摄取料罐筒口并含有卸料通孔的采集视频;并从中获取P张图片组成图片集,将卸料孔用红色矩形标注出,按照比例将图片集分成训练数据集和验证数据集;
S2:利用K-means聚类分析算法计算出训练数据集在进行tiny_yolov3网络模型训练时所需要的候选框尺寸;
步骤S2中,计算候选框尺寸的具体步骤为:
S21:对所述训练数据集中的图片进行标注,得到训练数据集中所有标注框的参数bbox=(x,y,H,W,c,s),其中x,y表示目标框中心点坐标;H,W为目标框的高和宽,c为目标框类型,s为目标框的识别率;
S22:将所有目标框随机分成h类,并设定h类目标框的预设类尺寸,h为正整数;
S22:计算所有目标框的尺寸与h个预设类尺寸的距离;
S23:对训练数据集的所有目标框进行归类:将目标框归类至其尺寸与预设类尺寸距离最小的一类,得到h类新的目标框;
S24:获取h类新的目标框的尺寸,将该新的目标框的尺寸作为所述目标框尺寸;
S3:采用训练数据集对tiny_yolov3网络模型进行训练,得到tiny_yolov3网络的权重文件;
S4:将摄像设备所采集到的验证数据集的图片输入tiny_yolov3网络,经过卷积层处理后,得到多尺度特征图;采用logistic函数对网络预测的x、y、置信度、类别概率进行激活;
S5:设定识别率阈值和IOU阈值用于对步骤S4得到的预测值进行判定;
S6:针对步骤S5的判定结果,如果满足阈值要求,将上述结果通过非极大值抑制处理产生最终的目标检测框和识别结果;若不满足阈值结果,采用获取运动轨迹方法对目标框进行检测。
2.根据权利要求1所述的复杂背景下的大钟料罐容器移动目标视觉定位与动态跟踪方法,其特征在于:在步骤S3中,采用训练数据集对tiny_yolov3网络模型进行训练,得到tiny_yolov3网络模型,具体为:设置训练参数和环境配置参数,运用tiny_yolov3模型的Keras代码对训练数据集,以十折交叉法进行tiny_yolov3网络模型训练。
3.根据权利要求2所述的复杂背景下的大钟料罐容器移动目标视觉定位与动态跟踪方法,其特征在于:所述训练参数至少包括目标框分类数、训练次数、批处理大小数、一批数据中的样本数量、学习率、输入图片大小和训练次数;
环境配置包括操作系统、Python版本、GPU版本、CUDA版本、CUDNN版本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910988849.7/1.html,转载请声明来源钻瓜专利网。