[发明专利]一种用于高速视频中圆形标识点的自动识别方法在审
申请号: | 202111490699.0 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114373144A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 洪中华;李竺朋;张宏扬;潘海燕;马振玲;周汝雁;张云;韩彦岭;王静;杨树瑚;徐利军 | 申请(专利权)人: | 上海海洋大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06K9/62;G06N3/04;G06N3/08;G06V10/25;G06V10/44;G06V10/764;G06V10/80;G06V10/82 |
代理公司: | 上海唯智赢专利代理事务所(普通合伙) 31293 | 代理人: | 姜晓艳 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 高速 视频 圆形 标识 自动识别 方法 | ||
1.一种用于高速视频中圆形标识点的自动识别方法,其特征在于包括以下步骤:
步骤一、建立检测网络模型,所述检测网络模型包括目标检测网络YOLOv4、显著性检测网络BASNet和圆心检测模块,所述目标检测网络YOLOv4用于圆形标识点的边框进行识别,所述显著性检测网络BASNet用于边框所在图像中的圆形标识点进行二值化处理,所述圆心检测模块用于对二值化处理后的圆心标识进行圆心检测;
步骤二、对图像样本集中各个图像中的圆形标识点分别进行标注,再依据标注好的各个边框的尺寸大小,选择目标检测网络YOLOv4中合适的检测头用于边框识别,然后以标注好的图像作为输入,对检测网络模型进行训练;
步骤三、利用训练好的检测网络模型对高速视频中各帧图像中各个圆形标识点的自动识别。
2.根据权利要求1所述的用于高速视频中圆形标识点的自动识别方法,其特征在于:所述目标检测网络YOLOv4包括主网络、特征融合网络以及三个检测头,所述主网络采用五层结构的CSPDarknet53网络,用于对圆形标识点进行特征提取,获取特征图金字塔,分别为256×256大小的特征图、128×128大小的特征图、64×64大小的特征图、32×32大小的特征图、16×16大小的特征图;
所述特征融合网络采用路径聚合PANet网络结构,用于将128×128、64×64和32×32大小的特征图和经过SPP网络增强的16×16大小的特征图进行特征融合,生成能够识别128×128大小、64×64大小、32×32大小图像的三个检测头;
所述圆心检测模型基于最小二乘法的椭圆拟合算法,对二值化处理后的圆心标识进行圆心检测。
3.根据权利要求2所述的用于高速视频中圆形标识点的自动识别方法,其特征在于:每个所述检测头的输出信息如下
3×((μtx,∑tx,μty,∑ty,μtw,∑tw,μth,∑th)+objscore+classscore)
其中,tx、ty、tw和th分别是边框的中心点坐标、宽度和高度,objscore表示边框中是否存在对象,classscore表示对象类别的概率,μ(x)和∑(x)分别是对应的均值和标准差函数,
预测得分的计算公式如下所示,
Cr.=σ(Object)×σ(Classi)×(1-Uncertaintyaver)
其中,σ(Object)反映的是边框里包含圆形标识点的概率,σ(Classi)表示为是第i类的概率,i=1,Uncertaintyaver表示4个预测结果tx、ty、tw和th的平均不确定性。
4.根据权利要求2所述的用于高速视频中圆形标识点的自动识别方法,其特征在于:利用聚类算法计算边框的尺寸分布,再根据尺寸分布情况选择合适尺寸的检测头进行圆形标识点识别,并且输入目标检测网络YOLOv4的图像均需预先处理至统一尺寸512×512。
5.根据权利要求1所述的用于高速视频中圆形标识点的自动识别方法,其特征在于:所述显著性检测网络BASNet包括预测模块和残差模块,所述预测模块用于对识别出的边框图像进行处理,生成粗略的显著性图,所述残差模块用于学习预测模块生成的显著性图和真实的边框图像之间的残差,以细化预测模块的显著性图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海洋大学,未经上海海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111490699.0/1.html,转载请声明来源钻瓜专利网。