[发明专利]一种基于混合分类器的可自主学习多目标检测方法在审
申请号: | 201710238904.1 | 申请日: | 2017-04-13 |
公开(公告)号: | CN107092878A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 罗大鹏;曾志鹏;魏龙生;罗林波;马丽 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 武汉华旭知识产权事务所42214 | 代理人: | 邱琳 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 分类 自主 学习 多目标 检测 方法 | ||
技术领域
本发明涉及一种基于混合分类器的可自主学习多目标检测方法,属于模式识别领域。
背景技术
视频监控在社区住宅、交通设施、金融机构、公共娱乐场所等各个领域中有着广泛的应用,作为监控中主要目标的车辆与行人,对其检测是智能视频处理的一个重要问题,因其融合多学科技术、拥有广阔市场前景而成为世界范围内各研究机构、公司企业的研究开发重点。但是,在多种动态变化场景中和不同拥挤程度下,稳定、准确地实现车辆与行人检测,仍然是难以很好实现的挑战性课题。
通过分析车辆的数目及运动信息,可以对交通的拥堵状况、平均车速由一个明确的了解。常用的车辆检测方法有:背景差分法、帧间差分法、光流法。背景差分法具有检测运动目标速度快、检测准确、易于实现的优点,但在实际应用中,静止背景不易直接获得,且由于背景图像的动态变化,需要有选择性地更新背景。帧差分法具有算法实现简单、程序设计复杂度低、运算速度快的优点,并且稳定性较好。但帧差分法不能提取出对象的完整区域,对帧间时间间隔依赖性较强,选择间隔不当时会造成很大误差。光流法的环境适应性强,但算法杂度高,难以保证车辆检测的实时性和实用性。
行人检测技术存在检测区域环境复杂,如天气的影响、光照的变化、行人的不确定行动等,同时要求处理准确高、稳定性强,所以该项技术成为多学科交叉研究的热点。对于行人检测常用的方法有如下几种:(1)基于全局特征的方法,该方法是目前较为主流的行人检测方法,主要采用边缘特征、形状特征、统计特征或者变换特征等图像的各类静态特征来描述行人,其中代表性的特征包括Haar小波特征、HOG特征、Edgelet特征、Shapelet特征和形状轮廓模板特征等。(2)基于人体部件的方法,该方法的基本思想是把人体分成几个组成部分,然后对图像中每部分分别检测,最后将检测结果按照一定的约束关系进行整合,最终判断是否存在行人。(3)基于立体视觉的方法,该方法是指通过2个或2个以上的摄像机进行图像采集,然后分析图像中目标的三维信息以识别出行人。
然而现有的一些检测方法常常有很多弊端,比如,Haar特征应用于行人检测时,性能有所下降。研究表明,在10-1误检率的情况下只有约50%的检测率,并且对场景有着较高的要求。Edgelet利用的是局部特征,该方法对于不同姿态的行人检测及互相遮挡的行人检测,处理效果较好。然而,由于Edgelet特征需要手动标定,所以对该特征的提取比较复杂,对于一些本身较为复杂的曲线,难以通过手动标定的方法得到符合人体曲线的Edgelet特征。SIFT特征对于提取图像的不变特征可以取得非常不错的效果,但是仍然存在很多缺陷,比如:有时候提取的特征点会比较少、实时性一般、无法提取边缘比较模糊的目标对象等。
发明内容
为了解决现有技术的不足,本发明提供了一种基于混合分类器的可自主学习多目标检测方法,只需要在视频的第一帧中框选出感兴趣的检测目标,该体系会自动根据所框选目标初始化目标检测分类器,并通过不断的自主学习,逐步提高分类器的检测性能。本方法采用随机蕨分类器和可迭代的SVM相结合的方法,共同作用于目标的检测分类,并对车辆和行人进行测试,均取得了较好的效果。
本发明为解决其技术问题所采用的技术方案是:提供了一种基于混合分类器的可自主学习多目标检测方法,包括以下步骤:
(1)获取样本并初始化混合分类器:
(1.1)初始化随机蕨分类器:
(1.1.1)在视频的第一帧中框选出待检测目标做正样本,在不含目标区域的背景中随机框选出与正样本相同数量的负样本,对每个样本进行n1次仿射变换,将仿射变换后的结果作为初始训练随机蕨分类器的正样本和负样本;
(1.1.2)在得到的每个样本中随机提取3个像素块作为该样本的一个随机蕨,各样本中提取的3个像素块位于各样本的相同位置;共选取n2*n2个随机蕨,将其平均分为n2组,每组n2个随机蕨;
(1.1.3)对随机蕨中的每个像素块,比较其左半部分所有像素值之和Ileft与右半部分所有像素值之和Iright的大小以及上半部分所有像素值之和Itop与下半部分所有像素值之和Ibottom的大小,根据比较结果对每个像素块的特征编码为2位二进制数;每个样本中的特征按照相同的顺序组合,则步骤(1.1.2)中,每个样本在随机蕨上统计的特征形成一个六位数的二进制编码,其对应的十进制数有64种可能数值,每个样本对应于随机蕨中的一个数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710238904.1/2.html,转载请声明来源钻瓜专利网。