[发明专利]一种行人识别及定位方法在审
申请号: | 201811337935.3 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109614870A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 张军;陈伟能;詹志辉;余维杰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩形区域 行人识别 检测 训练阶段 向量 图像 定位图像 多峰分布 估计算法 检测结果 检测图像 矩形窗口 输出检测 正样本集 线性SVM 分类器 负样本 样本 判定 制作 | ||
本发明公开了一种行人识别及定位方法,包括训练阶段和检测阶段,训练阶段具体包括以下步骤:制作正样本集和负样本集;提取样本的HOG特征向量;训练SVM分类器。检测阶段包括:输入待识别定位图像;检测个体对应图像的一个矩形区域;提取矩形区域的HOG特征向量;利用线性SVM分类器判定矩形窗口是否包含行人;当已经检测完图像中所有的矩形区域时,输出检测结果,否则继续检测图像。本发明基于HOG‑SVM行人识别框架及多峰分布估计算法MEDA识别,在获得更快的检测速度的同时获得更准确的检测结果。
技术领域
本发明涉及计算机视觉以及智能进化算法两个领域,特别涉及一种基于HOG-SVM行人识别框架及多峰分布估计算法MEDA的识别及定位行人方法。
背景技术
行人识别是目前计算机视觉的一个十分重要也非常富有挑战性的一个问题。近十年来,凭借着在智能机器人、智能驾驶、智能监控系统等领域起到越来越重要的作用,越来越多的科研者投入到行人识别的研究工作中。
总的来说,行人识别可以分成两个主要的研究方向。其一是提出新的行人特征描述符,行人特征描述符的作用是从图像中提取特征,将行人与其他物体区分开,目前流行的行人特征描述符有HaarWavelet、Learning Shapelet、Histogram of Oriented Gradient(HOG)、self-similarity on color channels(CSS)等,其中,凭借着对光照变化及行人动作的细微改变的鲁棒性,HOG成为了目前最热门的行人特征描述符。其二是研究如何定位图像中的行人,即研究如何在一整幅图像找到其所有行人,目前最普遍使用的定位方法是利用滑动窗口去遍历整幅图像,输出所有包含行人的矩形区域。
基于上述两个研究方向,研究人员已经提出了许多可行的方法。其中最常见、最基本的行人识别方法是由Dalal和Triggs于2005年提出的HOG-SVM算法,Dalal和Triggs将他们提出的HOG特征描述符与线性SVM分类器相结合构成HOG-SVM行人识别框架,并利用滑动窗口定位行人,此框架能够很好地完成行人识别这一任务。虽然HOG-SVM在行人识别问题上能够取得较好的效果,但是HOG-SVM在检测率及检测速度上仍具有非常大的改善空间。
为了提高HOG-SVM的检测效率,研究人员已经为此进行了大量的工作。其中,Watanabe等人利用co-HOG,即“梯度对”,代替HOG去描述行人的特征。此外,Walk等人提出一种新的特征描述符——区域颜色的自相似性,作为HOG的补充特征。以上工作都能很好地提高经典HOG-SVM算法的精度,但是随之也降低了算法的检测速度。
为了提高HOG-SVM的检测速度,Zhu等人提出利用积分直方图来快速计算行人的HOG特征,并且在Adaboost的基础上构建级联的分类器,Zhu等人的研究能很好地加速传统HOG-SVM的检测过程,但其训练时间也大大增加。为在不影响训练速度的前提下提高算法的检测速度,一部分研究人员将目光转移到元启发式算法上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811337935.3/2.html,转载请声明来源钻瓜专利网。