[发明专利]一种基于位置分布的大规模场景目标感知方法在审
申请号: | 202211118645.6 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115661620A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 刘庆杰;刘晨光;高广帅;王蕴红 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06N3/0464;G06N3/08;G06V10/40;G06V10/82 |
代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 高永 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 位置 分布 大规模 场景 目标 感知 方法 | ||
1.一种基于位置分布的大规模场景目标感知方法,其特征在于,包括依次进行的如下步骤:
(1)将给定的大规模场景输入到主干网络中进行特征提取,其中主干网络为高分辨率特征金字塔网络HRFPN;
(2)将经过主干网络中进行特征提取后的场景数据输入至多重卷积层进行处理,其中每层卷积层后面都接一个线性修正单元ReLu激活层;
(3)基于多重卷积层进行处理后的数据,计算输出预测的定位图,目标偏移和目标边界框的宽和高;其中,通过计算定位图中的局部最大值得到目标中心点的位置坐标,通过目标中心点的位置坐标得到目标边界框的宽和高;
(4)基于定位图,设置局部放缩模块LSM自适应的搜索定位图图像中的聚集区域,并对其进行适量的放缩以适合检测器的容量;
(5)修改原始数据的一部分损失函数,使得能够更容易的进行训练。
2.如权利要求1所述的方法,其特征在于:所述步骤(2)中多重卷积层包括卷积层和反卷积层,其中卷积层表示为“Conv-卷积核-通道-步幅”,反卷积层表示为“TransConv-卷积核-通道-步幅”。
3.如权利要求2所述的方法,其特征在于:所述步骤(2)中多重卷积层设置依次为Conv-1-384-1,TransConv-4-64-1,TransConv-4-64-1和Conv-1-1。
4.如权利要求3所述的方法,其特征在于:所述步骤(3)中计算输出预测的定位图,采用距离变换图作为定位回归的方式生成。
5.如权利要求1或4所述的方法,其特征在于:所述步骤(3)中计算输出预测的定位图具体为:
假定S表示所有目标中心点的集合,(x,y)表示欧氏距离变换图上的横纵坐标,(x',y')表示集合S中的目标中心点坐标,然后将欧式距离变换图表述为:
采用两种距离变换图,反距离变换图FIDTM和高斯加权距离变换图GDTM进行处理,具体表示如下:
GD=e-γD(x,y)
其中α、β和γ都是超参数,按照经验设定为0.02、0.75和0.02;C是一个避免分母为0的常数,设为C=1;
两种距离变换图的方式都采用高分辨率特征金字塔网络HRFPN作为主干网络,然后增加一个卷积层和两个反卷积层作为定位回归。
6.如权利要求5所述的方法,其特征在于:所述步骤(4)中具体为:
(4.1)给定预测得到的距离变换图,通过局部最大值检测的方法得到预测的定位图;
(4.2)将预测的定位图平均分为16×10的网格,统计每个网格中目标的数量,然后根据数量从大到小进行排序;
(4.3)选择出数量最多的前15个网格,并通过八联通区域算法获得较大的候选区域,即选择出图像中聚集区域。
7.如权利要求6所述的方法,其特征在于:所述步骤(4.3)还包括:先对连通区域进行放大适当的尺度,使得裁剪区域能够覆盖完整的目标,滤除掉小于某个阈值的裁剪块;将裁剪区域放大到适合网络的尺寸,余下的部分则用零进行填充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211118645.6/1.html,转载请声明来源钻瓜专利网。