[发明专利]一种目标计数方法及装置在审

申请号：	202111562514.2	申请日：	2021-12-20
公开（公告）号：	CN114331982A	公开（公告）日：	2022-04-12
发明（设计）人：	田野;初祥祥;张勃	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06T7/00	分类号：	G06T7/00;G06V10/82;G06V10/80;G06V10/774;G06N3/04
代理公司：	北京曼威知识产权代理有限公司 11709	代理人：	邓超
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种目标计数方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书公开了一种目标计数方法及装置。通过将图形输入编码器得到若干尺寸不同的编码特征，以确定用于输入解码器的并列设置的各卷积模块的融合编码特征。针对每个卷积模块，通过该卷积模块，对融合编码特征进行卷积，得到该卷积模块对应的解码特征，以基于各解码特征得到该图像对应的融合解码特征。并基于融合解码特征确定该图像的目标计数结果。基于对计数模型结构的改进，避免在深度方向堆叠众多卷积层，能够提高目标计数效率，以及目标计数结果的准确性。

技术领域

本说明书涉及计算机视觉技术领域，尤其涉及一种目标计数方法及装置。

背景技术

目标计数(如人群计数、车辆计数等)技术是如今计算机视觉领域的研究热点。

以人群计数为例，通常，通过将采集的人群图像输入计数模型，对图像进行卷积以提取图像特征，得到图像中包含的人数。但通常图像中包含的人远近不同，使得该图像中不同区域内的人尺度不同。对于不同尺度的图像区域，则需要基于不同大小的感受野进行卷积，尺度越大的图像区域所需的感受野越大。

为了扩大感受野，准确地对同一图像中不同尺度的目标进行识别。现有的计数模型在通过主干网络对图像进行卷积得到图像特征后，将图像特征输入堆叠有数量众多的卷积层的下游网络进一步进行特征提取。在下游网络中，利用大小相同的卷积核连续对图像进行卷积，以逐渐扩大感受野，得到基于不同尺度的感受野进行连续卷积所提取到的特征。

然而，基于连续的多次卷积在扩大感受野的同时，也使得模型结构复杂而计数效率低。

发明内容

本说明书提供一种目标计数方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种目标计数方法，包括：

将图像输入计数模型的编码器，得到若干尺寸不同的编码特征，并根据各编码特征确定所述图像对应的融合编码特征；

将所述融合编码特征分别输入所述计数模型的解码器的各卷积模块，针对每个卷积模块，通过该卷积模块，对所述融合编码特征进行卷积，得到该卷积模块对应的解码特征；其中，各卷积模块中卷积核对应的感受野不同；

根据各卷积模块对应的解码特征，确定融合解码特征，根据所述融合解码特征，确定所述图像的目标计数结果。

可选地，所述尺寸包括：分辨率以及通道数；

将图像输入计数模型的编码器，得到若干尺寸不同的编码特征，并根据各编码特征确定所述图像对应的融合编码特征，具体包括：

将图像输入计数模型的编码器，得到若干尺寸不同的编码特征，并将分辨率最大的编码特征作为基准特征；

针对所述基准特征外的每个编码特征，对该编码特征进行上采样，得到与所述基准特征分辨率相同的特征，作为该编码特征对应的分辨率还原特征；