[发明专利]一种基于Haar‑like特征的司机面部特征快速检测方法有效

专利信息
申请号: 201410163867.9 申请日: 2014-04-22
公开(公告)号: CN103902990B 公开(公告)日: 2017-03-29
发明(设计)人: 凌强;李佳桐;李峰 申请(专利权)人: 中国科学技术大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 北京科迪生专利代理有限责任公司11251 代理人: 成金玉,孟卜娟
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于Haar‑like特征的司机面部特征快速检测方法,第一个阶段是利用分类器对当前图像小块进行检测,并根据检测的结果估计图像小块内容与目标的相似程度。第二个阶段是根据本次的检测结果,结合算法来对下一次检测的结果进行相似度估计,并根据估计结果,调节搜索的步长和分类器的检测精度。第三个阶段是结合司机驾驶的场景,根据已检测到的包含目标的区域的位置信息,估计目标所在的准确位置。本发明采用动态调整分类器检测精度的方式,在不降低准确度的情况下,减少了分类器的重复调用次数,缩短了检测时间,提高了检测效率。
搜索关键词: 一种 基于 haar like 特征 司机 面部 快速 检测 方法
【主权项】:
一种基于Haar‑like特征的司机面部特征快速检测方法,其特征在于实现步骤如下:(1)从摄像头读取一帧视频流图像;(2)将读取的视频流图像中的MJPEG格式图像解码为灰度图;(3)根据上一帧的检测结果,确定当前帧检测的感兴趣区域;(4)计算检测的感兴趣区域的积分图;(5)根据积分图计算感兴趣区域的Haar‑like特征;(6)设定检测的起始点,检测采用滑动窗口的方式,即在感兴趣区域内设置滑动窗口,检测时,滑动窗口在感兴趣区域从左上角开始,从左向右,从上到下地滑动;(7)利用分类器对滑动窗口内的图像块进行检测,在滑动窗口检测的过程中,滑动窗口每移动一次,就利用分类器对滑动窗口内的图像块进行检测;(8)根据分类器检测结果,估计滑动窗口内的图像与目标图像的相似度;(9)根据上一步估计的相似度,计算下一次检测滑动窗口的移动步长和分类器的检测精度;(10)估计目标的准确位置,采用分类器,对滑动窗口内的图像块进行检测,若滑动窗口内的图像块通过分类器的检测,则认为是候选目标,记录图像块的位置;根据所有通过分类器的图像块的位置,融合得到目标的位置;最后根据得到的目标位置,估计出目标的准确位置;(11)输出目标位置,并进行下一帧的检测;所述步骤(7)分类器的组织形式为多层弱分类器串联的形式,其组织形式如下:设整个分类器由N个弱分类器串联而成;每一层均对滑动窗口内的图像块进行判定,滑动窗口内的图像块只有通过前一级分类器,才能接受下一级的判定,有一级分类器做出否定判决,则判定图像块不是目标,不进行下一级的判定;只有通过分类器所有层的判定,图像块才能成为候选目标,图像块位置记为所述步骤(9)中的滑动窗口步长的计算,包括滑动窗口水平移动步长和滑动窗口垂直移动步长,其中滑动窗口水平移动步长计算过程如下:xsnk=2,ifcnk=N4,if0≤cnk<N]]>N为分类器的最大层数,为图像块通过的分类器最大层数;即若图像块通过分类器所有层的判断,即则步长为2,滑动窗口向右移动2个像素;移动后,滑动窗口左上角坐标为滑动窗口的宽度和高度仍然分别为Ww、Hw;若图像块没有通过分类器所有层的判断,即则步长为4,滑动窗口向右移动4个像素;移动后,滑动窗口左上角的坐标为滑动窗口的高度和宽度仍然分别为Ww、Hw;所述滑动窗口竖直方向移动步长确定如下:在检测时,滑动窗口在区域内滑动,首先进行第一行检测,即RDk=1,从区域左侧开始,向右滑动检测;在滑动到行末后,滑动窗口下移一定的像素数,进行第二行检测,即开始进行第RDk=2行的检测;如此反复,到检测满足终止条件,其中RDk表示滑动窗口已检测完的和正在检测的行数之和;根据每一行的检测结果,调整滑动窗口竖直方向移动步长步长的调整策略为:若在第RDk行的检测中,没有出现即没有任何一图像块通过分类器检测,则本行检测结束时,设定竖直移动步长为4,即第RDk+1行的检测中,第RDk+1行滑动窗口的起始坐标为若在第RDk行的检测中,出现了至少一次也就是至少有一个图像块通过了分类器的所有层,则本行检测结束时,设定竖直步长为2,即在第RDk+1行的检测中,第RDk+1行滑动窗口的起始坐标为所述步骤(9)中的分类器检测精度计算公式如下:csn+1k=N-4,ifcnk=Ncnk-2,if5≤cnk<N0,if0≤cnk<5]]>为图像块通过的分类器最大层数;上式表明,若第k帧中,滑动窗口第n次检测的图像块通过分类器判定,即则下次也就是第n+1次检测时,分类器的起始层数即分类器从倒数第4层开始检测;若在第n次检测中,图像块通过了分类器前五层的检测,但又没有最终通过所有层的检测,即则在第n+1次检测中,分类器的起始检测层数,为上一次终止层数的前两层,即若在第n检测中,图像块没有通过分类器前五层的检测,即在前五层的某一层被否定则在第n+1测检测中,从分类器的起始层开始检测,即所述步骤(10)估计目标准确位置过程为:(11)确定检测的截止条件若图像块能够通过分类器所有层的判定,则该图像块定义为候选目标,此时滑动窗口的位置记录为其中m表示第m个候选目标;每获得M个候选目标,即在m=M、2M、3M……时,就对检测结果进行一次融合,融合采用重叠面积加权的方式,融合规则如下:(111)记录已检测到的候选目标的位置为候选目标的区域为矩形,其宽度和高度分别为Ww、Hw;(112)计算各候选目标两两间的重叠面积,记为Sl|i,表示候选目标区域l和i的重叠面积,计算方法如下:Wl|i=min(cxlk,cxik)+Ww-max(cxlk,cxik)]]>Hl|i=min(cylk,cyik)+Hw-max(cylk,cyik)]]>Sl|i=Wl|i×Hl|i其中Wl|i、Hl|i分别为重叠区域的宽度和高度;重叠面积为Sl|i,i和l分别表示第i个和第l个候选目标,且i,l∈{x|1≤x≤m,x∈N},i≠l;(113)进行结果融合,获得目标的位置,计算公式如下:SumSk=Σl=1l=mΣi=1,l≠ii=mSl|i]]>txk=Σl=1l=mΣi=1,i≠li=mSl|iSumSkcxlk]]>tyk=Σl=1l=mΣi=1,i≠li=mSl|iSumSkcylk]]>其中SumSk为各候选目标区域的重叠面积之和,txk和tyk分别为融合结果的横坐标和纵坐标;(114)对结果进行判断,若txk和tyk有一个为0,则融合无效,需继续用滑动窗口进行检测,当再检测到M个候选目标时,即一共2M个候选目标时,返回步骤(112)继续进行融合;若txk和tyk都不为0,则融合有效,将融合后的目标结果记录下来,再进行检测终止条件判断;(115)检测终止条件,当检测到两个目标时,即成功融合了两次;或滑动窗口已搜索过全部感兴趣区域,则检测终止条件为真,检测结束,开始进行目标准确位置估计;结束后,获得的目标个数为TN;若检测终止条件为假,则继续用滑动窗口在感兴趣区域内进行检测;(12)目标准确位置估计根据检测结果对获得的TN个目标位进行估计,估计的结果用矩形表示,左上角坐标为(Txk,Tyk),宽度和高度分别为Ww、Hw;若TN=0,则没有检测目标,需进行第k+1帧的检测;若TN=1,即只检测到一个目标,则不需要融合,直接将检测到的一个目标输出,即若TN=2,即检测到两个目标坐标,分别为T1:和T2:应用于检测司机的鼻子和嘴相关显著特征时,需要对检测结果进行融合,所述融合方法如下:Txk=tx1k+tx2k2,Tyk=ty1k+ty2k2]]>输出为,左上角坐标(Txk,Tyk),宽度和高度分别为Ww、Hw的矩形。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410163867.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top