[发明专利]面向无人机航拍图像的分割引导注意力群体计数方法在审
申请号: | 202210740932.4 | 申请日: | 2022-06-28 |
公开(公告)号: | CN115019211A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 范哲意;宋梓豪;吴迪;朱艺璇 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/82;G06V10/26;G06N3/08;G06N3/04 |
代理公司: | 北京康度知识产权代理事务所(特殊普通合伙) 11705 | 代理人: | 王彬 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 无人机 航拍 图像 分割 引导 注意力 群体 计数 方法 | ||
1.一种面向无人机航拍图像的分割引导注意力群体计数方法,所述方法包括:
获取包括训练集和测试集在内的图像集;
对训练集中的图像进行预处理;
将预处理后的图像输入网络,训练网络,直至网络拟合,训练后的网络输出图像的密度图和分割图,所述网络包括卷积块,Inception级联模块、上采样器、浅层分割引导注意力模块、深层分割引导注意力模块以及第一加法器和第二加法器;以及
根据网络输出的密度图,将密度图的像素值求和得到图像中的群体计数。
2.根据权利要求1所述的方法,其特征在于,训练网络的步骤包括:
卷积块将预处理后的图像处理为特征F1,F1的通道数为768;
将特征F1分别输入Inception级联模块和浅层分割引导注意力模块,分别得到特征F2,S1和D1,特征F2的通道数为2048,S1的通道数为1,特征D1的通道数为1;
通过上采样器对得到的特征F2进行上采样,上采样后的特征的尺寸变为特征F2的两倍,然后将上采样后的特征F2输入深层分割引导注意力模块,分别得到特征S2和D2,特征S2和特征D2的通道数分别为1和1;
通过第一加法器将得到的特征S1和S2加权求和,最终得到与输入图像尺寸相同的预测分割图;
通过第二加法器将得到的特征D1和D2加权求和,最终得到与输入图像尺寸相同的预测密度图;
通过调整特征S1和S2以及特征D1和D2的权重以使最小化损失函数,直至网络拟合,
损失函数为:
表示密度图损失,如式(2),
其中表示生成的第i张输入图像Xi对应的预测密度图,θ表示整个网络可训练的参数,Di表示图像Xi的真值密度图,N是训练样本数,
表示分割图损失,如式(3),
其中表示生成的第i张输入图像Xi对应的预测分割图,Wi表示真值分割图,Hi(j,k)构成交叉熵损失矩阵H,(j,k)是预测分割图里的每个点的坐标,⊙表示逐元素乘法。
3.根据权利要求2所述的方法,其特征在于,卷积块包括5个卷积层、第一InceptionA至第三InceptionA、InceptionB以及第一InceptionC至第四InceptionC。
5个卷积层分别是:
Conv:3×3,32;
Conv:3×3,32;
Conv:3×3,64;
Conv:3×3,80;
Conv:3×3,192;
其中,Conv为卷积,3×3,32表示卷积核大小为3×3,输出特征的通道数为32;3×3,64表示卷积核大小为3×3,输出特征的通道数为64,3×3,80表示卷积核大小为3×3,输出特征的通道数为80,3×3,192表示卷积核大小为3×3,输出特征的通道数为192;
InceptionA:将输入特征复制4份,将其分别送入4条分支,从左到右,分支A1对输入特征进行1×1卷积;分支A2对输入特征先进行1×1卷积再进行5×5卷积;分支A3对输入特征首先进行1×1卷积,再进行两次3×3卷积;分支A4对输入特征先进行池化操作再进行1×1卷积,最后将4个分支的所有输出按照通道联接,作为最终输出特征,其通道数为288;
InceptionB:将输入特征复制3份,将其分别送入3条分支,从左到右,分支B1对输入特征进行3×3卷积;分支B2对输入特征首先进行1×1卷积,再进行两次3×3卷积;分支B3对输入特征进行池化操作,最后将3个分支的所有输出按照通道联接,作为最终输出特征,其通道数为768;
InceptionC:将输入特征复制4份,将其分别送入4条分支,从左到右,分支C1对输入特征进行1×1卷积;分支C2对输入先进行1×1卷积再进行深度可分离卷积,其中深度可分离卷积由1×7和7×1卷积组成;分支C3对输入特征首先进行1×1卷积,再进行两次深度可分离卷积,其中深度可分离卷积由1×7和7×1卷积组成;分支C4对输入特征进行池化操作再进行1×1卷积;最后将4个分支的所有输出按照通道联接,作为最终输出特征,其通道数为768。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210740932.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序