[发明专利]基于生成对抗网络的人群计数方法有效

专利信息
申请号: 201810476256.8 申请日: 2018-05-17
公开(公告)号: CN108764085B 公开(公告)日: 2022-02-25
发明(设计)人: 徐奕;倪冰冰;沈赞 申请(专利权)人: 上海交通大学
主分类号: G06V20/52 分类号: G06V20/52;G06V10/774;G06V10/82;G06K9/62;G06T7/00;G06N3/04;G06N3/08
代理公司: 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 代理人: 徐红银
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 生成 对抗 网络 人群 计数 方法
【权利要求书】:

1.一种基于生成对抗网络的人群计数方法,其特征在于,包括:

构建生成对抗网络,所述生成对抗网络包括:生成器和判别器;所述生成器用于根据输入的人群图像生成对应的人群密度图像;所述判别器用于在所述生成对抗网络的训练阶段,判别所述生成器生成的人群密度图像的真伪;

对所述生成对抗网络进行跨尺度一致性训练,得到训练后的生成对抗网络;

将待统计的人群图像作为所述训练后的生成对抗网络的输入,得到目标人群密度图像,并统计所述目标人群密度图像中的人数;

在所述对所述生成对抗网络进行跨尺度一致性训练,得到训练后的生成对抗网络,包括:

获取人群图像和所述人群图像进行N等分后的N个子图像块;其中N为大于等于2的自然数;

将所述人群图像输入生成对抗网络,得到第一人群密度图像;

将所述人群图像对应的N个子图像块依次输入生成对抗网络,得到N个人群密度子图;将N个人群密度子图进行合成后,得到第二人群密度图像;

分别统计第一人群密度图像和第二人群密度图像中的人数;

当所述第一人群密度图像和第二人群密度图像中的人数不一致时,对所述生成对抗网络的生成器进行调整,直到所述第一人群密度图像和第二人群密度图像中的人数一致;

保存对生成器的调整结果,得到训练后的生成对抗网络。

2.根据权利要求1所述的基于生成对抗网络的人群计数方法,其特征在于,在所述对所述生成对抗网络进行跨尺度一致性训练,得到训练后的生成对抗网络之前,还包括:

获取训练数据库中的人群图像;

构建第一图像对和第二图像对,所述第一图像对包括:人群图像,以及该人群图像对应的人群密度标注图像;所述第二图像对包括:人群图像,以及该人群图像通过生成器得到的人群密度图像;

将第一图像对和第二图像对分别通过判别器判断真伪;

当所述判别器判断人群密度标注图像或者人群密度图不是真实图像时,对所述判别器进行调整后,继续通过训练数据库中的人群图像对所述生成器进行训练;

当所述判别器判断人群密度标注图像和人群密度图均为真实图像时,保存对所述生成器的调整结果。

3.根据权利要求1-2中任一项所述的基于生成对抗网络的人群计数方法,其特征在于,所述生成对抗网络中的生成器中采用U-net网络结构作为识别人群图像中人群特征的编码器和解码器,所述U-net网络结构中包含有跳跃式传递层,以使得所述生成器输出与输入人群图像尺寸相同的人群密度图像。

4.根据权利要求1-2中任一项所述的基于生成对抗网络的人群计数方法,其特征在于,所述生成对抗网络中的生成器包括:第一网络结构和第二网络结构;所述第一网络结构和第二网络结构为对称关系;

第一网络结构为:CBL(64,6)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-DBLO(64,4)-DBLO(64,4)-DBLO(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(3,6)–Tanh;其中:C是指卷积层,B是指批归一化,L是指激活层LReLU,D是指反卷积层,O是指流失层,且括号中的第一个数表示卷积的通道数,第二个数表示卷积核的尺寸;

第二网络结构为:CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-CBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(64,4)-DBL(3,4)–Tanh;其中:C是指卷积层,B是指批归一化,L是指激活层LReLU,D是指反卷积层,O是指流失层,且括号中的第一个数表示卷积的通道数,第二个数表示卷积核的尺寸;

LReLU:

Tanh为:

式中:x表示输入,LReLU(x)为激活函数,tanh(z)为激活函数,z表示输入。

5.根据权利要求1-2中任一项所述的基于生成对抗网络的人群计数方法,其特征在于,所述生成对抗网络中的判别器包括:第一判别器和第二判别器;且所述第一判别器和第二判别器具有相同的网络结构;所述网络结构为:CB(48)-CBL(96)-CBL(192)-CBL(384)-C(1)–Sigmoid;其中:C是指卷积层,B是指批归一化,L是指激活层LReLU,Sigmoid是指Sigmoid层,括号中的数表示卷积的通道数;

所述Sigmoid为:

式中:x表示输入,Sigmoid(x)为激活函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810476256.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top