[发明专利]基于极值点特征增强的FCOS智能目标检测方法有效
申请号: | 202110641861.8 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113435266B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 丁颜玉;陈剑;卢贵主;林娴静;曾淼旺;刘婵梓 | 申请(专利权)人: | 东莞理工学院 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/44;G06V10/764 |
代理公司: | 北京汇彩知识产权代理有限公司 11563 | 代理人: | 王键 |
地址: | 523000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 极值 特征 增强 fcos 智能 目标 检测 方法 | ||
1.一种基于极值点特征增强的FCOS智能目标检测方法,其特征在于包含以下步骤:
步骤一:构建极值点特征增强FCOS检测器,检测器的检测头Head架构为讲FPN中输出都各层特征图输入到回归子网络和分类子网络,最终的总损失为定位损失、分类损失和极值点损失三者之和;
所述回归子网络具体为
经过4个【256,3*3,256】卷积之后得到回归特征reg_feat,回归特征reg_feat进一步经过1个【256,3*3,256】卷积和1个【256,3*3,8】卷积得到极值点Offset;然后将回归特征reg_feat和偏移Offset输入到【256,3*3,256】可变形卷积,并经过【256,3*3,4】卷积得到预测框坐标;
所述极值点Offset的回归目标Offset_Target是来自标注极值点相对基准点的偏移,通过训练Offset与Offset_Target之间的极值点损失来学习Offset;
所述分类子网络具体为
经过4个【256,3*3,256】卷积之后得到分类特征cls_feat,然后将分类特征cls_feat和偏移Offset输入到【256,3*3,256】可变形卷积cls_dcn_feat,cls_dcn_feat并经过【256,3*3,81】卷积得到预测的分类得分,cls_dcn_feat同时经过【256,3*3,1】卷积得到预测的中心度分数;
所述标注极值点相对基准点的偏移计算过程为
目标实例的极值点为4个点,分别为最左点,最上点,最右点,最下点,其坐标分别为(xl,yl),(xt,yt),(xr,yr),(xb,yb);
极值点直接转换为两个角点所有构成的边界框,两个角点即左上角点和右下角点(x1,y1)和(x2,y2),对应极值点中的坐标为(xl,yt),和(xr,yb);
对于极值点标注信息的获取,采用ExtremeNet检测器中的转换方法,从COCO实例分割Mask标注中提取极值点标注信息,然后经过尺寸缩放Resize和随机水平翻转Flip处理转换得到检测器网络中的极值点标注信息gt_extremes;
把标注框以及标注极值点分配到基准点,将标注框及标注极值点分配到基准点之后,进一步计算极值点到基准点的偏移;
所述进一步计算极值点到基准点的偏移具体过程为
在标准的FCOS检测器中,计算边界框4个边界到基准点的距离(l,t,r,b),分别表示左边界,上边界,右边界和下边界的距离;
距离(l,t,r,b)的具体计算方法如下:
l=x-x1
t=y-y1
r=x2-x
b=y2-x
其中(x,y)为基准点坐标,而(x1,y1)和(x2,y2)表示边界框左上角点和右下角点坐标;
将边界框左上角点右下角点(x1,y1),(x2,y2)改写为(xl,yt),(xr,yb),则求边界框到基准点的距离(l,t,r,b)变为:
l=x-xl
t=y-yt
r=xr-x
b=yb-y
目标实例的4个极值点表示为(xl,yl),(xt,yt),(xr,yr),(xb,yb),可以看出边界框两个角点的4个值【(xl,yt),(xr,yb)】,实则包含在4个极值点的8个值中;为了训练学习极值点8个值剩余4个值【yl,xt,yr,xb】,设计其回归目标为【lh,tw,rh,bw】,
具体计算方法如下:
lh=yl-y
tw=xt-x
rh=yr-y
bw=xb-x
目标实例的4个极值点的坐标如下:
极左点:(xl,yl)
极顶点:(xt,yt)
极右点:(xr,yr)
极底点:(xb,yb)
可计算目标实例4个极值点到基准点的偏移Offset如下:
极左点offset:(offset_lx,offset_ly)=(xl,yl)-(x,y)=【(xl-x),(yl-y)】=(-l,lh)
极顶点offset:(offset_tx,offset_ty)=(xt,yt)-(x,y)=【(xt-x),(yt-y)】=(tw,-t)
极右点offset:(offset_rx,offset_ry)=(xr,yr)-(x,y)=【(xr-x),(yr-y)】=(r,rh)
极底点offset:(offset_bx,offset_by)=(xb,yb)-(x,y)=【(xb-x),(yb-y)】=(bw,b)
用这4个极值点offset作为可变形卷积DCN的4个偏移输入,DCN的其余5个偏移都设置为0,即指向基准点;
步骤二:通过步骤一建立的极值点特征增强FCOS检测器检测图像中的目标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞理工学院,未经东莞理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110641861.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种政企物联网业务访问系统
- 下一篇:一种基于联邦学习的疾病筛查方法