[发明专利]一种俯视图像的目标计数方法、系统及存储介质在审
申请号: | 202111496641.7 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114170188A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 关佶红;魏畅;刘天颖;杨涵晨;张毅超;周水庚 | 申请(专利权)人: | 同济大学;复旦大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 俯视 图像 目标 计数 方法 系统 存储 介质 | ||
本发明提供一种俯视图像的目标计数方法,其特征在于,包括以下步骤:步骤S1,采集俯视图像并生成图像数据集。步骤S2,利用几何自适应高斯卷积方法对图像数据集进行处理。步骤S3,构建回归计数神经网络模型。步骤S4,将真实密度图集作为训练集输入到回归计数神经网络模型进行监督训练,得到训练完成的回归计数神经网络模型。步骤S5,利用几何自适应高斯卷积方法对待计数图像进行处理。步骤S6,待计数图像的真实密度图输入到训练完成的回归计数神经网络模型。步骤S7,对待计数图像的预测密度图进行积分,得到待计数图像的目标个数。本发明提供一种俯视图像的目标计数系统。本发明提供一种俯视图像的目标计数存储介质。
技术领域
本发明涉及一种俯视图像的目标计数方法、系统及存储介质。
背景技术
随着城市化建设速度的加快,道路车辆数量愈发变多,城市的道路系统也愈加复杂,导致车辆与道路之间的关系变得更难以处理。能够实现准确的车辆计数,了解路面车辆信息,对于现代的道路系统建设与道路交通资源再分配有着重要意义,而常用的基于路口摄像头的车辆计数存在着目标易被遮挡,方向单一的问题。而利用光学遥感技术与无人机航拍技术所得到的俯视视角图像,包含着更广阔的空间范围,可以对大范围道路进行直接监测,得出道路的全局信息,此外,其具有的俯视视角特性减少了车辆被遮挡的可能性,可以提高识别精度,这使得对道路车辆进行系统全面的计数成为可能。
目前通用的目标计数采用基于检测的计数方法和基于回归的计数方法。基于检测的方法是参考目标检测模型,在计数任务中,都是先生成目标的检测框并给出预测概率值,再对检测框的数量进行统计,得出最终的计数结果;基于回归的方法是参考回归计数模型,直接对整张图像生成预测的密度图,再对密度图进行逐位积分,得到整体数量的统计。对于较为密集的目标,回归计数可以忽略精确的定位,达到更好的计数效果,而检测计数可以在计数的同时保证目标的定位效果和可解释性。但是,目前的两种方法在面对俯视图像的车辆计数中都存在着以下缺陷:一方面,通用方法缺少对目标比例变化的适应性,在多尺度目标图像的计数中效果欠佳,另一方面,通用方法对目标密集区域的计数稳定性较差。因此,亟需设计一种能够克服上述缺陷的技术方案。
发明内容
为解决上述问题,提供一种俯视图像的目标计数方法、系统及存储介质,本发明采用了如下技术方案:
本发明提供了一种俯视图像的目标计数方法,其特征在于,包括以下步骤:步骤S1,采集俯视图像,并生成图像数据集。步骤S2,利用几何自适应高斯卷积方法对图像数据集进行处理,得到真实密度图集。步骤S3,构建回归计数神经网络模型。步骤S4,将真实密度图集作为训练集输入到回归计数神经网络模型,利用损失函数Loss进行监督训练,当满足训练结束条件,训练结束并得到训练完成的回归计数神经网络模型。步骤S5,利用几何自适应高斯卷积方法对待计数图像进行处理,得到待计数图像的真实密度图。步骤S6,待计数图像的真实密度图输入到训练完成的回归计数神经网络模型,得到待计数图像的预测密度图。步骤S7,对待计数图像的预测密度图进行积分,得到待计数图像的目标个数。其中,回归计数神经网络模型包括基于VGG-16的预训练模块、注意力模块、多尺度适应模块和方向适应模块。注意力模块包括卷积层、softmax层和全连接层。多尺度适应模块包括多尺度卷积层、池化层和全连接层。方向适应模块包括卷积层、可变形卷积层、可变形池化层和全连接层。几何自适应高斯卷积方法的计算公式为:式中,N为图像中计数目标的个数,xi是所要计数的目标在图像中的坐标,x为坐标变量,为冲激函数,表示图像中计数目标的冲击响应函数,F(x)为真实密度图集中的某一真实密度图的像素,为自适应的高斯核,σi为高斯核的标准差。
本发明提供的一种俯视图像的目标计数方法,还可以具有这样的技术特征,其中,损失函数Loss的具体表达式为:式中,L(θ)为欧几里得距离,SSIM为图像结构相似性的损失函数,λ为权重参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学;复旦大学,未经同济大学;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111496641.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序