[发明专利]一种基于深度学习的行人属性识别方法和系统有效
申请号: | 201910713743.6 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110688888B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 刘潇;王弯弯;黄晓峰;殷海兵;贾惠柱 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 行人 属性 识别 方法 系统 | ||
1.一种基于深度学习的行人属性识别方法,其特征在于,包括:
根据行人样本数据集构建行人属性数据集,按照平衡类别对所述行人属性数据集的数据进行分类;
对于不同平衡类别的数据,使用过采样和/或欠采样进行调整,包括:对于不同平衡类别的数据,通过过采样和欠采样的方法微调,按照不平衡程度,依次对于每一个类别随机复制稀有类的样本1%,舍弃大类样本1%,循环若干次,得到平衡度均衡的样本;再次统计分析各个平衡类别的比例,生成交叉熵误差的权重因子;所述交叉熵误差的权重因子W=1-α*,其中α*=n/N,n为重新取样后属于该平衡类别的样本数,N为重新取样后的总样本数;
利用行人姿态模型提取颈部臀部关键点,将行人样本数据集中的原始图片分为整体、头部、上半身、下半身四部分,将四部分图片分别输入对应的神经网络模型中;
计算每个神经网络模型的交叉熵误差和三元组误差,并将两种误差求和累加,梯度回传训练网络直至收敛;其中所述交叉熵误差由根据所述权重因子修正的交叉熵计算得到;
使用训练后的神经网络模型识别行人属性。
2.根据权利要求1所述的方法,其特征在于,
所述平衡类别包括:平衡、不平衡、极不平衡三类。
3.根据权利要求1所述的方法,其特征在于,
所述行人样本数据集由监控或者视频中的图像中获得,通过截取图像中包含人的部分,得到各种行人的原始图片,组成行人样本数据集。
4.根据权利要求1所述的方法,其特征在于,
所述行人姿态模型和神经网络模型均采用ResNet18卷积神经网络模型。
5.根据权利要求1所述的方法,其特征在于,
设z=[z0,...,zC-1]表示一个样本的非softmax输出,C表示该样本的标签,则所述交叉熵误差表示为:
6.根据权利要求5所述的方法,其特征在于,
所述三元组误差表示为:
其中,f(xa)为锚点,为正样本,为负样本。
7.一种基于深度学习的行人属性识别系统,其特征在于,包括:
分类模块,用于根据行人样本数据集构建行人属性数据集,按照平衡类别对所述行人属性数据集的数据进行分类;
调整模块,用于对于不同平衡类别的数据,使用过采样和/或欠采样进行调整,包括:对于不同平衡类别的数据,通过过采样和欠采样的方法微调,按照不平衡程度,依次对于每一个类别随机复制稀有类的样本1%,舍弃大类样本1%,循环若干次,得到平衡度均衡的样本;再次统计分析各个平衡类别的比例,生成交叉熵误差的权重因子;所述交叉熵误差的权重因子W=1-α*,其中α*=n/N,n为重新取样后属于该平衡类别的样本数,N为重新取样后的总样本数;
裁剪模块,用于利用行人姿态模型提取颈部臀部关键点,将行人样本数据集中的原始图片分为整体、头部、上半身、下半身四部分,将四部分图片分别输入对应的神经网络模型中;
训练模块,用于计算每个神经网络模型的交叉熵误差和三元组误差,并将两种误差求和累加,梯度回传训练网络直至收敛;其中所述交叉熵误差由根据所述权重因子修正的交叉熵计算得到;
识别模块,用于使用训练后的神经网络模型识别行人属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910713743.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无后视镜车辆的横向图像处理装置和方法
- 下一篇:一种图文内容比对方法及装置