[发明专利]一种基于生成对抗神经网络的人群计数方法以及系统在审
申请号: | 201811388878.1 | 申请日: | 2018-11-21 |
公开(公告)号: | CN109523538A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 王丽;傅冰飞;彭垚;李斌;薛向阳 | 申请(专利权)人: | 上海七牛信息技术有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 201203 上海市浦东新区自由贸易*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 源数据 训练模型 人群 计数模型 目标数据 神经网络 判别模型 预设 对抗 标注 处理效率 模型创建 获取源 密度图 无监督 预测 迁移 场景 优化 学习 图片 | ||
本发明实施例提供了一种基于生成对抗神经网络的人群计数方法以及系统,所述方法包括:获取源数据,对所述源数据进行标注处理,所述源数据包括预设数量的图片;采用预设的模型创建计数模型以及判别模型;根据所述源数据训练所述计数模型,使其能够预测所述源数据对应的人群密度图,得到第一训练模型;分别将所述源数据以及待识别的目标数据作为输入,根据所述计数模型以及判别模型,优化所述第一训练模型,得到第二训练模型;采用所述第二训练模型预测所述目标数据对应的人群密度以实现人群计数。本发明实施例通过生成对抗神经网络,无需对目标数据进行标注,节省了人力,提高了处理效率,可以实现无监督迁移学习,适用于多个场景的人群计数。
技术领域
本发明涉及计算机图像检测领域,尤其涉及一种基于生成对抗神经网络的人群计数方法以及系统。
背景技术
随着技术的不断进步,通过机器视觉来进行图像识别以实现现实场景人群个数统计日益普遍。
现阶段采用深度学习来进行图像识别的手段通常是对训练集的样本进行标注,然后进行训练。由于标注的工作量较大,当识别场景切换时,往往需要重新进行标注训练,这使得这种模型往往无法适用于其他场景,可移植性较差,适用范围不广。
发明内容
本发明实施例提供一种基于生成对抗神经网络的人群计数方法以及系统,通过生成对抗网络,无需目标场景的标注,节省人力,适用于多个场景的人群计数。
本发明实施例第一方面提供了一种基于生成对抗神经网的人群计数方法,包括:
获取源数据,对所述源数据进行标注处理并生成对应的人群密度图,所述源数据包括预设数量的图片;
采用预设的模型创建计数模型以及判别模型;
根据所述源数据训练所述计数模型,得到第一训练模型;
分别将所述源数据以及待识别的目标数据作为输入,根据所述计数模型以及判别模型,优化所述第一训练模型,得到第二训练模型;
采用所述第二训练模型预测所述目标数据以实现人群计数。
可选的,所述采用预设的模型创建计数模型以及判别模型,包括:
所述计数模型采用VGG-16模型的卷积层并加额外添加2层空洞卷积层。
可选的,所述根据所述源数据训练所述计数模型,得到第一训练模型,包括:
获取所述源数据及其对应的标注信息;
采用随机梯度下降法对所述计数模型进行训练。
可选的,所述根据所述源数据训练所述计数模型,得到第一训练模型,包括:
根据所述计数模型生成的密度图确定任务损失函数。
可选的,所述分别将所述源数据以及待识别的目标数据作为输入,根据所述计数模型以及判别模型,优化所述第一训练模型,得到第二训练模型,包括:
将所述目标数据的金字塔图片区域作为输入,所述金字塔图片区域共享中心点;
所述计数模型分别根据所述源数据以及所述目标数据的金字塔图片区域,生成对应的密度图;
所述判别模型判断所述密度图的来源,所述来源包括源数据以及目标数据;
根据所述判别模型的判断结果优化所述第一训练模型。
可选的,所述金字塔尺寸比例为1,0.8,0,6,0,4。
可选的,所述根据所述判别模型的判断结果优化所述第一训练模型,包括:
采用自适应矩估计法进行优化。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海七牛信息技术有限公司,未经上海七牛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811388878.1/2.html,转载请声明来源钻瓜专利网。