[发明专利]一种目标计数方法及装置在审
申请号: | 202111562514.2 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114331982A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 田野;初祥祥;张勃 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/82;G06V10/80;G06V10/774;G06N3/04 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 计数 方法 装置 | ||
本说明书公开了一种目标计数方法及装置。通过将图形输入编码器得到若干尺寸不同的编码特征,以确定用于输入解码器的并列设置的各卷积模块的融合编码特征。针对每个卷积模块,通过该卷积模块,对融合编码特征进行卷积,得到该卷积模块对应的解码特征,以基于各解码特征得到该图像对应的融合解码特征。并基于融合解码特征确定该图像的目标计数结果。基于对计数模型结构的改进,避免在深度方向堆叠众多卷积层,能够提高目标计数效率,以及目标计数结果的准确性。
技术领域
本说明书涉及计算机视觉技术领域,尤其涉及一种目标计数方法及装置。
背景技术
目标计数(如人群计数、车辆计数等)技术是如今计算机视觉领域的研究热点。
以人群计数为例,通常,通过将采集的人群图像输入计数模型,对图像进行卷积以提取图像特征,得到图像中包含的人数。但通常图像中包含的人远近不同,使得该图像中不同区域内的人尺度不同。对于不同尺度的图像区域,则需要基于不同大小的感受野进行卷积,尺度越大的图像区域所需的感受野越大。
为了扩大感受野,准确地对同一图像中不同尺度的目标进行识别。现有的计数模型在通过主干网络对图像进行卷积得到图像特征后,将图像特征输入堆叠有数量众多的卷积层的下游网络进一步进行特征提取。在下游网络中,利用大小相同的卷积核连续对图像进行卷积,以逐渐扩大感受野,得到基于不同尺度的感受野进行连续卷积所提取到的特征。
然而,基于连续的多次卷积在扩大感受野的同时,也使得模型结构复杂而计数效率低。
发明内容
本说明书提供一种目标计数方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种目标计数方法,包括:
将图像输入计数模型的编码器,得到若干尺寸不同的编码特征,并根据各编码特征确定所述图像对应的融合编码特征;
将所述融合编码特征分别输入所述计数模型的解码器的各卷积模块,针对每个卷积模块,通过该卷积模块,对所述融合编码特征进行卷积,得到该卷积模块对应的解码特征;其中,各卷积模块中卷积核对应的感受野不同;
根据各卷积模块对应的解码特征,确定融合解码特征,根据所述融合解码特征,确定所述图像的目标计数结果。
可选地,所述尺寸包括:分辨率以及通道数;
将图像输入计数模型的编码器,得到若干尺寸不同的编码特征,并根据各编码特征确定所述图像对应的融合编码特征,具体包括:
将图像输入计数模型的编码器,得到若干尺寸不同的编码特征,并将分辨率最大的编码特征作为基准特征;
针对所述基准特征外的每个编码特征,对该编码特征进行上采样,得到与所述基准特征分辨率相同的特征,作为该编码特征对应的分辨率还原特征;
对所述分辨率还原特征进行常规卷积,得到与所述基准特征通道数相同的特征,作为该编码特征对应的与所述基准特征尺寸相同的还原特征;
将各编码特征对应的还原特征与所述基准特征进行叠加,得到所述图像对应的融合编码特征。
可选地,所述解码器的卷积模块包括混合卷积模块以及单一卷积模块;
将所述融合编码特征分别输入所述计数模型的解码器的各卷积模块,针对每个卷积模块,通过该卷积模块,对所述融合编码特征进行卷积,得到该卷积模块对应的解码特征,具体包括:
将所述融合编码特征分别输入所述计数模型的解码器的各混合卷积模块,并将所述融合编码特征输入所述解码器的单一卷积模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111562514.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:头枕和车辆
- 下一篇:一种自适应供给瞬时冷却分块式薄片金刚石砂轮