[发明专利]面向无人机航拍图像的分割引导注意力群体计数方法在审

专利信息
申请号: 202210740932.4 申请日: 2022-06-28
公开(公告)号: CN115019211A 公开(公告)日: 2022-09-06
发明(设计)人: 范哲意;宋梓豪;吴迪;朱艺璇 申请(专利权)人: 北京理工大学
主分类号: G06V20/17 分类号: G06V20/17;G06V10/82;G06V10/26;G06N3/08;G06N3/04
代理公司: 北京康度知识产权代理事务所(特殊普通合伙) 11705 代理人: 王彬
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 无人机 航拍 图像 分割 引导 注意力 群体 计数 方法
【权利要求书】:

1.一种面向无人机航拍图像的分割引导注意力群体计数方法,所述方法包括:

获取包括训练集和测试集在内的图像集;

对训练集中的图像进行预处理;

将预处理后的图像输入网络,训练网络,直至网络拟合,训练后的网络输出图像的密度图和分割图,所述网络包括卷积块,Inception级联模块、上采样器、浅层分割引导注意力模块、深层分割引导注意力模块以及第一加法器和第二加法器;以及

根据网络输出的密度图,将密度图的像素值求和得到图像中的群体计数。

2.根据权利要求1所述的方法,其特征在于,训练网络的步骤包括:

卷积块将预处理后的图像处理为特征F1,F1的通道数为768;

将特征F1分别输入Inception级联模块和浅层分割引导注意力模块,分别得到特征F2,S1和D1,特征F2的通道数为2048,S1的通道数为1,特征D1的通道数为1;

通过上采样器对得到的特征F2进行上采样,上采样后的特征的尺寸变为特征F2的两倍,然后将上采样后的特征F2输入深层分割引导注意力模块,分别得到特征S2和D2,特征S2和特征D2的通道数分别为1和1;

通过第一加法器将得到的特征S1和S2加权求和,最终得到与输入图像尺寸相同的预测分割图;

通过第二加法器将得到的特征D1和D2加权求和,最终得到与输入图像尺寸相同的预测密度图;

通过调整特征S1和S2以及特征D1和D2的权重以使最小化损失函数,直至网络拟合,

损失函数为:

表示密度图损失,如式(2),

其中表示生成的第i张输入图像Xi对应的预测密度图,θ表示整个网络可训练的参数,Di表示图像Xi的真值密度图,N是训练样本数,

表示分割图损失,如式(3),

其中表示生成的第i张输入图像Xi对应的预测分割图,Wi表示真值分割图,Hi(j,k)构成交叉熵损失矩阵H,(j,k)是预测分割图里的每个点的坐标,⊙表示逐元素乘法。

3.根据权利要求2所述的方法,其特征在于,卷积块包括5个卷积层、第一InceptionA至第三InceptionA、InceptionB以及第一InceptionC至第四InceptionC。

5个卷积层分别是:

Conv:3×3,32;

Conv:3×3,32;

Conv:3×3,64;

Conv:3×3,80;

Conv:3×3,192;

其中,Conv为卷积,3×3,32表示卷积核大小为3×3,输出特征的通道数为32;3×3,64表示卷积核大小为3×3,输出特征的通道数为64,3×3,80表示卷积核大小为3×3,输出特征的通道数为80,3×3,192表示卷积核大小为3×3,输出特征的通道数为192;

InceptionA:将输入特征复制4份,将其分别送入4条分支,从左到右,分支A1对输入特征进行1×1卷积;分支A2对输入特征先进行1×1卷积再进行5×5卷积;分支A3对输入特征首先进行1×1卷积,再进行两次3×3卷积;分支A4对输入特征先进行池化操作再进行1×1卷积,最后将4个分支的所有输出按照通道联接,作为最终输出特征,其通道数为288;

InceptionB:将输入特征复制3份,将其分别送入3条分支,从左到右,分支B1对输入特征进行3×3卷积;分支B2对输入特征首先进行1×1卷积,再进行两次3×3卷积;分支B3对输入特征进行池化操作,最后将3个分支的所有输出按照通道联接,作为最终输出特征,其通道数为768;

InceptionC:将输入特征复制4份,将其分别送入4条分支,从左到右,分支C1对输入特征进行1×1卷积;分支C2对输入先进行1×1卷积再进行深度可分离卷积,其中深度可分离卷积由1×7和7×1卷积组成;分支C3对输入特征首先进行1×1卷积,再进行两次深度可分离卷积,其中深度可分离卷积由1×7和7×1卷积组成;分支C4对输入特征进行池化操作再进行1×1卷积;最后将4个分支的所有输出按照通道联接,作为最终输出特征,其通道数为768。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210740932.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top