[发明专利]监控场景下基于ResNet-50的行人属性识别方法在审
申请号: | 201910425208.0 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110457984A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 杨晓宇;殷光强;张裕星;向凯;殷雪朦 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 51244 成都其高专利代理事务所(特殊普通合伙) | 代理人: | 廖曾;贺立中<国际申请>=<国际公布>= |
地址: | 611731四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性识别 卷积神经网络 损失函数 监控场景 监控视频 实验模型 网络结构 行人数据 挖掘 测试集 数据集 训练集 预测 构建 改进 标签 评估 分析 联合 统一 学习 | ||
本发明公开了监控场景下基于ResNet‑50的行人属性识别方法,包括以下步骤:1)选用公开数据集和监控视频,构建行人数据集;2)选用ResNet‑50卷积神经网络模型作为实验模型;3)对loss损失函数进行改进,并提出N+1类预测方法进行N/A标签的预测;4)把训练集输入改进loss损失函数后的ResNet‑50卷积神经网络,得出行人属性识别模型;5)将测试集输入到行人属性识别模型中进行识别,对行人属性识别模型的实验结果进行评估;采用ResNet‑50网络结构,可以分析更深层次的行人属性,更好的挖掘属性之间的关系,在挖掘属性之间的关系时,提出了统一的多属性联合学习框架来同时识别多属性。
技术领域
本发明涉及模式识别技术、计算机视觉技术等领域,具体的说,是监控场景下基于ResNet-50的行人属性识别方法。
背景技术
近年来,随着模式识别和计算机视觉的发展,目标识别技术得到了很大的发展,并且在安防领域实现了大量的应用。安防人员通过分布在城市各个角落的监控摄像头,维护着城市安全。如果发生了突发事故,要从海量的监控图像中寻找到需要的信息,必然会损耗大量的人力物力。摄像头监控的主要目标是行人,如果可以实现对行人属性有效的识别,会给监控视频检索工作带来很大的便利。由于这种需求,越来越多的研究人员开始研究行人属性识别。
行人属性识别的一种传统识别算法为人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型。基于人工神经网络的训练算法为反向传播算法,它使得网络模型经过对大量训练样本进行学习的过程能够获得统计规律,从而对未知事件做出预测。人工神经网络优点在于具有较强的非线性映射能力、自学习和自适应能力、泛化能力和一定的容错能力,但是存在以下缺点,在行人识别样本训练时收敛速度慢,且其训练过程为监督过程,而对训练样本的标注即费时又费力,并且视频行人识别涉及到大量数据的计算和分析,外加一些环境因素的干扰,传统行人属性识别算法无法提取到图像的优越特征,导致识别率有限。
在监控场景下,摄像头远距离拍摄行人,造成图片的分辨率较低,大部分图片很模糊,再加上光照变化(白天和夜晚),监控摄像头不同拍摄角度行人姿态的不同变化,现实生活中物体的遮挡等,造成行人是否佩戴眼镜等细粒度的属性很难识别出来,给研究工作带来了极大的挑战性。
国内外对监控场景下的行人属性识别的研究工作还是比较少的。Layne是第一个通过支持向量机(SVM)去识别行人属性的。为了解决混合场景下的属性识别问题,Zhu等人引入了行人数据库,并利用增强算法对属性进行识别。 Deng等人建了当时最大的行人属性数据库(PETA),利用支持向量机和马尔科夫随机场去进行属性识别。但是这些方法全部是采用人工提取行人特征,这往往需要根据人的经验,经验决定着识别的准确率,除此之外,这些方法把属性之间的联系完全切断开,没有考虑属性之间的相互作用,例如长头发的行人是女性的概率大于是男性的概率。
随着计算机视觉的飞快发展,研究人员开始使用卷积神经网络的方法进行特征提取作为行人外观属性特征,取得了很好的成果。公开号为 CN107862300A的专利公开了“一种基于卷积神经网络的监控场景下行人属性识别方法”和公开号为CN108460407A的专利公开了“一种基于深度学习的行人属性精细化识别”,但是他们使用的数据集没有N/A标签,属性识别准确度有一定的误差;除此之外,他们使用的卷积神经网络比较简单。
目前,行人属性识别主要研究于自然场景和监控场景。自然场景下的研究已经在人脸识别和属性识别取得了很大的成果,然而在自然场景下,由于图像模糊、分辨率差、姿态差异大、光照变化大,研究起来更加具有挑战性。
发明内容
本发明的目的在于提供监控场景下基于ResNet-50的行人属性识别方法,采用ResNet-50网络结构,可以分析更深层次的行人属性,更好的挖掘属性之间的关系,在挖掘属性之间的关系时,提出了统一的多属性联合学习框架来同时识别多属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910425208.0/2.html,转载请声明来源钻瓜专利网。