[发明专利]一种基于正负广义最大池化的行人识别方法有效
申请号: | 201610024377.X | 申请日: | 2016-01-13 |
公开(公告)号: | CN105718858B | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 孙锐;张广海;高隽;张旭东 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于正负广义最大池化的行人识别方法,包括:对采集的交通视频进行预处理,获得需要的训练样本图像,利用基于梯度的HOG局部描述符提取训练样本图像的局部特征,并通过由空间聚集受限玻尔兹曼机组成的深度分层编码方法对局部特征进行编码,形成训练样本的特征编码向量,再采用正负广义最大池化方法得到高层图像特征表示向量,将获得的特征数据输入支持向量机分类器,完成训练;对待测的行人图像进行预处理,得到测试样本,用同样的方式获得测试样本的特征表示向量;将测试样本的特征表示向量输入训练完成的支持向量机分类器,识别测试图像为行人还是非行人。本发明能提高行人识别的准确率,增强行人识别算法的鲁棒性。 | ||
搜索关键词: | 一种 基于 正负 广义 最大 行人 识别 方法 | ||
【主权项】:
1.一种基于正负广义最大池化的行人识别方法,其特征是按如下步骤进行:步骤1、从交通视频中随机选取N个行人训练图像和N个非行人训练图像,对所述N个行人训练图像和N个非行人训练图像分别进行预处理,获得N个行人正样本训练图像和N个非行人负样本训练图像;步骤2、利用HOG局部特征描述子对所述N个行人正样本训练图像和N个非行人负样本训练图像分别进行特征提取,获得行人特征集合x+和非行人特征集合x‑;步骤3、利用式(1)所示的深度分层编码函数获得第n个行人正样本训练图像中第j个行人特征编码向量和第n个非行人负样本训练图像中第j个非行人特征编码向量式(1)中,wj表示受限玻尔兹曼机加权矩阵W第j列的元素,wij是受限玻尔兹曼机加权矩阵W第i行第j列的元素,fenc(·,·)是前馈编码函数,σ(·)是sigmoid传输函数,I为局部图像描述子的维数;是第n个行人正样本训练图像的第i个行人特征,是第n个非行人负样本训练图像的第i个非行人特征;1≤i≤I;1≤n≤N;1≤j≤J;步骤4、将所述第n个行人正样本训练图像中所有行人特征编码向量进行级联,获得第n个行人正样本训练图像的行人特征编码向量将所述第n个非行人负样本训练图像的所有非行人特征编码向量进行级联,获得第n个非行人负样本训练图像的非行人特征编码向量步骤5、对所述行人特征编码向量按列排序,记为z+;对所述非行人特征编码向量按列排序,记为z‑;由z+和z‑构成特征编码向量Z;步骤6、采用正负广义最大池化方法对所述特征编码向量Z进行优化处理,获得特征表示向量Y;步骤6.1、利用式(2)所示的最大池化式对所述特征编码向量Z进行处理,获得第u个最大池化特征表示向量yu:yu=max{|zu1|,|zu2|,...,|zun|,...,|zuN|} (2)式(2)中,zun为所述特征编码向量Z的第u行第n列元素;1≤u≤N;步骤6.2、利用式(3)对所述最大池化特征表示向量yu进行处理,获得第u个正负最大池化特征表示向量yu,PN‑MP:式(3)中,zuv为所述特征编码向量Z的第u行第v列;从而获得所有正负最大池化表示向量{y1,PN‑MP,y2,PN‑MP,...,yu,PN‑MP,...,yN,PN‑MP};对所述所有正负最大池化表示向量{y1,PN‑MP,y2,PN‑MP,...,yu,PN‑MP,...,yN,PN‑MP}按列排序,记为y;步骤6.3、利用式(4)的正负广义最大池化式对所述正负最大池化特征表示向量y进行处理,获得特征表示向量Y:式(4)中,yT是y的转置矩阵,表示值全为1的N维向量,λ是正则化参数;步骤7、利用支持矢量机对所述特征表示向量Y进行训练,获得分类识别模型和分类函数阈值τ;步骤8、对待识别的测试图像分别按照步骤1和步骤2进行预处理和HOG特征提取,获得测试图像的特征集合xC;步骤9、利用式(5)所示的编码函数获得测试图像的第j个特征编码向量ZCj,从而获得测试图像的所有特征编码向量{zC1,zC2,...,zCj,...,zCJ}:式(5)中,xCi是测试图像特征集合xC中第i个测试图像特征;对所述测试图像的所有特征编码向量{zC1,zC2,...,zCj,...,zCJ}按列排序,记为Zc;步骤10、采用正负广义最大池化方法对所述测试图像的特征编码向量Zc进行优化处理,获得测试图像的特征表示向量Yc;步骤11、将所述测试图像的特征表示向量Yc输入所述分类识别模型中,从而获得识别结果;若所述识别结果大于分类函数阈值τ,则表示所述测试图像为行人图像,否则表示所述测试图像为非行人图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610024377.X/,转载请声明来源钻瓜专利网。