[发明专利]一种基于积分投影与边缘检测的快速人眼定位方法有效
申请号: | 201310119843.9 | 申请日: | 2013-04-09 |
公开(公告)号: | CN103218605A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 路小波;陈伍军;曾维理;杜一君;祁慧 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 江苏永衡昭辉律师事务所 32250 | 代理人: | 王剑 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 积分 投影 边缘 检测 快速 定位 方法 | ||
1.一种基于积分投影与边缘检测的快速人眼定位方法,其特征在于按照以下步骤进行:
步骤1:初始化,读入一张采集到含有人脸的图像 ,
步骤2:利用Adaboost算法对采集到的数字图像进行人脸检测操作,获取到其中的人脸图像,
步骤3:对步骤2中获取得到的人脸图像进行预处理,方法如下:
步骤3.1:将获取得到的人脸图像转化为人脸图像的灰度图像,并将人脸图像的灰度图像规格化为WH的图像,其中W、H均为正整数,分别表示人脸图像的灰度图像规格化为WH的图像的行数和列数,
步骤3.2:利用高斯滤波器对WH的图像进行平滑、去噪处理,具体方法如下:首先,平滑、去噪处理后的图像的各边界像素的灰度值分别为平滑、去噪处理前的WH的图像的各边界像素的灰度值;其次,对于WH的图像的非边界像素的灰度值,则以WH的图像中的任意一个非边界像素为中心像素,选取33的高斯模板,得到所述中心像素的灰度值,即:
式中,代表行坐标,代表列坐标,为图像中点的灰度值,为图像中以点为中心的33网格中位于点左下角点的灰度值,为图像中以点为中心的33网格中位于点左上角点的灰度值,为图像中以点为中心的33网格中位于点右下角点的灰度值,为图像中以点为中心的33网格中位于点右上角点的灰度值,为图像中以点为中心的33网格中位于点水平左方向点的灰度值,为图像中以点为中心的33网格中位于点正下方点的灰度值,为图像中以点为中心的33网格中位于点水平右方向点的灰度值,为图像中以点为中心的33网格中位于点正上方点的灰度值,为经过高斯滤波后点的灰度值,处理之后得到图像,其大小仍然为WH,遍历WH的图像中所有非边界像素,
步骤4:对图像进行水平积分投影,投影计算公式如下:
式中,表示第行的水平积分投影结果,为图像的点处的灰度值,W为图像行数,H为图像列数,
从W行的水平积分投影结果中选取灰度值最小的水平积分投影结果,并记为,为令水平积分投影计算公式取得最小值时的所对应的行数,从图像中选取出垂直坐标范围为区域,作为人眼可能存在的待检测区域,其中,,表示的值为的向下取整值,为人眼可能存在的垂直坐标区间估计参数,
步骤5:对图像进行边缘提取,具体实现过程如下:
步骤5.1:首先,进行梯度计算后的梯度幅值矩阵对应图像的各个边界点的像素灰度值为进行梯度计算前的图像的边界点的像素灰度值,其次,对于图像中非边界像素点,选取、,为水平方向边缘检测算子,为垂直方向边缘检测算子,计算非边界像素点处的水平方向、垂直方向的一阶偏导数,以及非边界像素点处的梯度幅值和梯度方向,计算公式如下:
式中代表图像中非边界像素点的灰度值,i为图像中非边界点的水平坐标,j为图像中非边界点的垂直坐标,为图像中以非边界像素点点为左上角元素的的网格中位于网格左下角的像素点的灰度值,为图像中以非边界像素点点为左上角元素的的网格中位于网格右上角的像素点的灰度值,为图像中以非边界像素点点为左上角元素的的网格中位于网格右下角的像素点的灰度值,、分别代表非边界像素点处的水平方向、垂直方向的一阶偏导数,代表非边界像素点的梯度幅值,代表非边界像素点的梯度方向,
步骤5.2:将步骤5.1中得到的每一非边界像素点的梯度方向值进行离散化得到新的梯度方向值,选取以非边界像素点为中心的33窗口,对的值进行处理,计算公式如下:
式中,和分别代表以非边界像素点为中心的33窗口中沿着方向的两个像素点的梯度幅值, 为经过上式处理之后的梯度幅值,以处理之后的梯度幅值作为中心元素,图像的边界点像素灰度值作为边界元素构造矩阵,该矩阵对应产生图像,
步骤6:对步骤5.2中得到的图像进行二值化,具体方法如下:
步骤6.1:采用最大类间方差法确定阈值,确定阈值的过程如下:
统计图像中每个像素点的灰度值,将最高的灰度值作为最高灰度级m,m为整数,则图像灰度级范围由区间[0,m]中的每一个整数值构成,灰度级为t的像素个数设为,则总的像素个数,各灰度值的概率为,若用整数将灰度分为两组、,为灰度级小于等于的灰度级组,为灰度级大于小于的灰度级组,利用如下公式计算两个灰度级组之间的方差:
式中,为整体图像平均值,为组的平均值,为组的概率,分别选取区间[0,m]中的每一个整数值作为k的取值,再分别计算每一个k值所对应的方差值,并从m+1个方差值中选出最大的方差值,再以最大的方差值所对应的k值作为阈值T,
步骤6.2:使用步骤6.1中得到的阈值T对图像进行二值化处理,图像中灰度值大于等于阈值T的像素将其灰度值设置为255,低于阈值T的像素灰度值设置为0,得到二值图像,
步骤7:精确确定人眼的水平位置与垂直位置,具体实现过程如下:
步骤7.1:针对二值图像,计算行、列复杂度函数,计算公式如下:
式中,代表行复杂度函数,代表列复杂度函数,代表图像中位于处的像素点的像素值,,为步骤4中获得的人脸区域参数,
步骤7.2:采用公知的均值滤波器,分别对行复杂度函数、列复杂度函数进行一维低通滤波得到新的行复杂度函数、新的列复杂度函数,通过计算寻找新的行复杂度函数的最大值点以及新的列复杂度函数的极大值点确定人眼位置坐标,经过计算得到函数的一个最大值点,函数的两个极大值点、,得到像素点、像素点,
步骤7.3:在步骤3.2中得到的新的图像中,分别选出步骤7.2得到的像素点、像素点的66邻域,该领域中的灰度值最小的两个像素点设定为人眼中心,并将灰度值最小的两个像素点的位置坐标确定为双眼坐标,。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310119843.9/1.html,转载请声明来源钻瓜专利网。