[发明专利]基于语义特征一致性监督金字塔网络的目标检测方法有效
申请号: | 202011458846.1 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112529005B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 何立火;柯俊杰;甘海林;韩博;高新波;唐杰浩;路文;蔡虹霞 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V10/774;G06V10/82;G06V10/80;G06V10/764;G06V10/25;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;杨春岗 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 特征 一致性 监督 金字塔 网络 目标 检测 方法 | ||
1.一种基于语义特征一致性金字塔网络的图像目标检测方法,其特征在于包括如下步骤:
(1)获取训练样本集K和测试样本集V:
获取目标检测数据集中的多幅大小为W×H的RGB三通道图像,并将其中N幅带有目标类别标签和目标位置坐标的RGB三通道图像作为训练样本集K={k1,k2,...,kn,...,kN},将M幅带有目标类别标签和目标位置坐标的RGB三通道图像作为测试样本集V={v1,v2,...,vm,...,vM},其中,N≥100000,M≥5000,kn表示第n个目标类别标签为目标位置坐标为的训练样本,vm表示第m个目标类别标签为目标位置坐标为的测试样本;
(2)构建基于语义特征一致性金字塔网络P的图像目标检测网络S:
构建包括区域卷积神经网络RCNN和语义特征一致性金字塔网络P的图像目标检测网络S,其中RCNN包括顺次连结的特征提取网络、候选区域生成网络和感兴趣区域分类回归网络;语义特征一致性监督金字塔网络P包括级联的非对称特征对齐侧接网络F和多尺度语义特征扩充网络E,F包括多个对称卷积层F′、多个横向非对称卷积层多个纵向非对称卷积层和多个可变形卷积层多尺度语义特征扩充网络E包括多个并行排布的自适应平均池化层A,以及与每个自适应平均池化层A级联的对称卷积层F″和通道融合层C;语义特征一致性金字塔网络P加载在特征提取网络与候选区域生成网络之间;
(3)对基于语义特征一致性金字塔网络P的图像目标检测网络S进行迭代训练:
(3a)初始化迭代次数为t,最大迭代次数为T,T≥20,当前基于语义特征一致性金字塔网络P的图像目标检测网络为St,并令t=1,St=S;
(3b)将训练样本集K作为St的输入进行前向推理,特征提取网络对每个训练样本进行多尺度特征提取,得到多尺度原始特征图集X={x1,x2,...,xn,...,xN},其中xn表示第n个训练样本kn对应的特征图子集,表示xn的第j个原始特征图,J≥4;
(3c)语义特征一致性金字塔网络P对X中的特征图子集进行特征融合,得到语义信息一致的融合特征图Y={y1,y2,...,yn,...,yN},yn表示xn对应语义信息一致的融合特征图:
其中,为卷积核间并行相加操作,为卷积核频域相乘操作;
(3d)候选区域生成网络对每个语义信息一致的融合特征图yn进行感兴趣区域位置预测,感兴趣区域分类回归网络对yn的感兴趣区域位置预测结果进行目标分类和位置预测,得到预测结果T={t1,t2,...,tn,...,tN},其中,tn表示yn对应的包括目标类别和位置的预测结果,
(3e)采用反向传播算法,Log损失函数计算感兴趣区域分类回归网络分类预测结果与训练样本的目标类别标签为的分类误差,Smooth L1损失函数计算感兴趣区域分类回归网络位置预测结果与训练样本的目标位置坐标为的回归误差,采用随机梯度下降法降低分类误差与回归误差,对S中卷积核参数ωt、各全连接层节点之间的参数υt进行更新,得到更新后的St;
(3f)判断t=T是否成立,若是,得到训练好基于语义特征一致性金字塔网络P的图像目标检测网络S*,否则,令t=t+1,并执行步骤(3b);
(4)获取目标检测识别结果:
将V中的测试样本作为训练好语义特征一致性金字塔网络P的图像目标检测网络S*的输入进行目标检测与识别,得到目标分类与位置的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011458846.1/1.html,转载请声明来源钻瓜专利网。