[发明专利]一种面向移动机器人多目标检测的分层特征融合方法在审
申请号: | 202011235706.8 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112329861A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 杨金福;袁帅;李明爱;王康 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 移动 机器人 多目标 检测 分层 特征 融合 方法 | ||
1.一种面向移动机器人多目标检测的分层特征融合方法,其特征在于,通过空洞卷积金字塔结构以及分层特征融合方法获取多尺度特征信息,有效提升目标检测算法对同一场景中不同尺度大小的物体的检测能力,从而提高智能机器人搜索物体的效率,包括以下步骤:
步骤1:初步获取特征图:将数据集中的图像输入到预训练好的改进后的VGG-16中,提取经过卷积Conv4_3得到的特征图T1;提取经过卷积Conv7得到的特征图T2;
步骤2:构建空洞卷积金字塔结构DCP:该结构包含3种不同扩张率的空洞卷积分支,将步骤1获取的特征图T1输入空洞卷积金字塔结构DCP1,三条分支的输出特征图分别为X1、X2、X3;将步骤1获取的特征图T2输入空洞卷积金字塔结构DCP2,三条分支的输出特征图分别为Y1、Y2、Y3;
步骤3:进行分层特征融合HFF:将步骤2经过DCP1结构得到的特征图X1、X2、X3进行分层特征融合HFF1,得到融合后的特征图F1;将步骤2经过DCP2结构得到的特征图Y1、Y2、Y3进行分层特征融合HFF2,得到融合后的特征图F2;
步骤4:获取不同大小特征图:将步骤3获取的特征图F2进行逐步卷积,得到不同大小的特征图F3、F4、F5、F6;
步骤5:获得待检测物体的类别和包围框:分别在获取的特征层F1、F2、F3、F4、F5、F6的每个像素上生成不同比例大小的包围框以及该包围框的类别置信度。然后,对这些包围框进行筛选,得到待检测物体的类别和包围框。
2.根据权利要求1所述的一种面向移动机器人多目标检测的分层特征融合方法,其特征在于,步骤1中所述的VGG-16网络包括13个卷积层、3个全连接层,卷积层依次为Conv1_1、Conv1_2、Conv2_1、Conv2_2、Conv3_1、Conv3_2、Conv3_3、Conv4_1、Conv4_2、Conv4_3、Conv5_1、Conv5_2、Conv5_3,全连接层依次为FC6、FC7、FC8;步骤1中所述改进后的VGG-16网络为:将VGG-16网络的FC6和FC7全连接层改为卷积层;步骤1中所述的初步获取的特征图T1为改进后的VGG-16网络中卷积层Conv4_3的输出,大小为38×38;T2为改进后的VGG-16网络中卷积层Conv7的输出,大小为19×19。
3.根据权利要求1所述的一种面向移动机器人多目标检测的分层特征融合方法,其特征在于,步骤2所述的空洞卷积金字塔结构DCP具体如下:
该结构包含3条支路,第1条支路依次为1×1的卷积层以及卷积大小为3×3、扩张率rate=1的空洞卷积层;第2条支路依次为1×1的卷积层,3×3的卷积层,以及卷积大小为3×3、扩张率rate=3的空洞卷积层;第三支路依次为1×1的卷积层,5×5的卷积层,以及卷积大小为3×3、扩张率rate=5的空洞卷积层;
将步骤1获取的特征图T1输入空洞卷积金字塔结构DCP1,三条分支的输出特征图分别为X1、X2、X3,大小均为38×38;将步骤1获取的特征图T2输入空洞卷积金字塔结构(DCP2),三条分支的输出特征图分别为Y1、Y2、Y3,大小均为19×19,DCP1与DCP2结构相同,输入特征图的大小不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011235706.8/1.html,转载请声明来源钻瓜专利网。