[发明专利]一种基于人脚图像的脚型分类方法有效
申请号: | 201510329437.4 | 申请日: | 2015-06-15 |
公开(公告)号: | CN104966099B | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 谢凤英;史蒙云;李阳;潘琛;孙婉盈 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京慧泉知识产权代理有限公司11232 | 代理人: | 王顺荣,唐爱华 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 脚型 分类 方法 | ||
1.一种基于人脚图像的脚型分类方法,其特征在于:其步骤如下:
步骤一:数据库的建立
收集大量的人脚正面的图像,对不同的脚进行脚型特征学习,收集过程包括以下三个方面:
(1)图像获取
将穿着纯色袜子的脚踩在水平地面上,并要求地面背景色与袜子颜色有一预定的区分度;穿黑色的袜子踩在浅色的地板上,镜头在脚的正上方垂直向下进行拍摄,使脚的中轴线与图像的垂直方向保持一致,并且保证脚掌部分全部包含在图像中,同时确保图像背景简单,即图像中只有脚目标和地面背景;
(2)数据收集
在保证采集背景与袜子颜色有区分度的情况下,变换不同的背景以及袜子颜色,对不同的人进行正面脚成像,共收集到300幅实验样本;
(3)样本真值的产生
标准脚型分为罗马脚、希腊脚和埃及脚,对一幅图像的脚型类别进行人工分类,并按大多数原则来确定图像的脚型类别,该类别即为该图像的脚型真值;
步骤二:预处理去阴影
对于收集到的300幅实验图像,采用显著性方法对脚掌部位进行增强,去除脚掌部位的阴影干扰;
步骤三:提取脚掌部位
该步骤中,采用大津阈值法实现图像的分割,将脚掌从图像中提取出来;
(1)图像二值化
所述的“大津阈值法”,详述如下:
假设t为目标与背景的分割阈值,像素灰度小于t的为目标,反之为背景像素;令目标像素点占图像比例为w0,平均灰度为u0,背景像素点占图像比例为w1,平均灰度为u1;
则图像的总平均灰度为:
目标和背景之间的方差为:
根据大津阈值原理,在[0,255]范围内,遍历阈值t,当方差g最大时,即能得到最佳的分割阈值t*;
(2)噪声和孔洞的去除
用t*对图像二值化处理后,图像背景中会出现噪声,脚目标的内部也会出现孔洞;根据先验知识,人脚对应了图像中最大的连通区域,因此搜索图像中最大的连通区域作为目标提取出来,而其他小的连通区域作为噪声滤除,同时,对于目标内部的孔洞,采用种子填充的方法进行去除;
步骤四:提取脚掌轮廓的特征
提取2个斜率和2个面积比作为脚型分类的特征;
(1)提取关键点
关键点包括轮廓最右侧点A、轮廓最上侧点B、脚掌轮廓最左侧点C、轮廓左上转折点D;点A、B、C是分别通过水平搜索最上侧点或者垂直搜索左右两侧最外侧的点得到;对于B和C之间的任意轮廓点,对B点竖直方向直线和C点水平方向直线做垂线并围成矩形,则D点是B和C之间所有轮廓点中围成矩形面积最大的点;
(2)斜率特征提取
假设p和q是两个关键点,且这两点之间的边缘点序列为(x1,y1),(x2,y2)…(xn,yn),用这个边缘点序列拟合出一条直线:
y=kx+b
上面公式中,k为拟合直线的斜率,b为拟合直线的偏置值;
根据最小二乘法原理,k和b的值由下列公式求出:
其中,
n为该边缘点序列的像素总个数;对关键点对(A,B)和(B,D),采用直线拟合方法,得到2条直线,而这2条直线的斜率特征即能用于后续的决策树分类;
(3)面积特征提取
对A点和B点做水平线和竖直线,利用四条直线得到一个矩形,依次统计矩形所围区域中脚内像素数sum_in和脚外像素数sum_out,计算脚外面积和脚内面积比:
Rate=sum_in/sum_out
同理,利用B点和D点亦能得到一个矩形,求得另一个面积比,这2个面积比特征与前面的两个直线特征一起用于后续的决策树分类;
步骤五:建立脚型分类模型
脚型分类问题是一个典型的模式分类问题,其中人脚图像是待识别模式,其对应的脚型为类标号,采用C4.5决策树方法来构建分类模型;
所述的“C4.5决策树方法”,详述如下:
设D为训练样本集,有sum个样本,分别属于C1,C2和C3三个类别,分别对应了罗马脚、希腊脚和埃及脚三种脚型,共有四个属性,包括两条直线斜率和两个面积比率;
(1)计算训练样本集类别信息熵
令cj为sum个样本中类别属于Cj的样本数,则
样本为Cj类的概率为:
样本集类别信息熵为:
其中,k为类别数,本发明中有三种脚型,因此k=3;
(2)计算属性V的信息增益率
选择其中一个属性V,其中V有互不重合的n个取值{v1′,v2′,v3′…vn′},将属性V的每一个取值vi′,按照从小到大进行排列,得到新的取值序列{v1,v2,v3…vn},则共生成n-1个分割点,共有n-1个划分方式,设第k个分割点取值为:
ak=(vk+vk+1)/2
它将该节点的数据集划分为2个数据子集,用[v1,ak],(ak,vn]的数据样本来表示属性V的取值;
属性V的n-1个划分的每一个情况都作为该属性的2个离散取值,重新构造该属性的离散值,则此时V的取值为V={m0,m1},其中m0表示v取值小于等于ak的集合,m1表示v取值大于ak的集合,令di为V=mi(i=0,1)的样本数,为是V=mi的样本中属于Cj的个数,接下来按以下步骤依次计算每个划分对应的信息增益率;
a)计算属性V每一个取值的信息熵
属性V=mi中,属于Cj类的概率为:
则属性V的类别条件信息熵
b)计算V=mi的概率
c)计算类别条件信息熵
Entropy(V)=p0I(V=m0)+p1I(V=m1)
d)计算属性V的信息增益
Gain(V)=I(C)-Entropy(V)
e)计算属性V的信息熵为
Split(V)=-(p0logp0+p1logp1)
f)计算属性V的信息增益率
选择其中信息增益率最大的分割阈值a*作为属性V的最佳分割阈值;
(3)递归执行(2),直到计算出每一个属性V的信息增益率,选择具有最大信息增益率的属性V*,并在其最佳分割阈值a*处创建节点;
(4)第(3)步中的叶节点所包含的样本如果属于不同类型,则对该叶节点中的样本递归执行第(1)至第(3)步,直到叶节点中只包含同类型数据;
步骤六:脚型分类预测
给定测试集,采用上述过程建立脚型分类模型,对于待分类的样本,提取该样本的关键点,计算两个斜率和两个面积特征,并将其输入到训练好的脚型分类模型,即能预测出该样本的类别属性;
在步骤二中所述的“显著性方法”,详述如下:
(1)颜色空间转换
将图像由RGB颜色空间转换到Lab颜色空间,包括两个步骤,首先将RGB颜色空间转换成XYZ颜色空间,再由XYZ颜色空间转换到Lab颜色空间;
①RGB颜色空间转换成XYZ颜色空间的方法如下:
②XYZ颜色空间转换成Lab颜色空间的方法如下:
L=116*f(Y)-16
a=500*[f(X)-f(Y)]
b=200*[f(Y)-f(Z)]
其中
上面公式中,L、a、b即为Lab色彩空间三个通道的值;
(2)获取各通道均值
Lab颜色空间中,每一个像素点对应一组通道值即L值、a值和b值,遍历整个图像的所有像素点,计算出每个通道均值和
上面公式中,n为图像中像素点个数;
(3)去除阴影
令(Li,ai,bi)为图像中第i个像素在L、a、b三个通道的值,则根据显著性公式,第i个像素的显著值为
其中m∈{L,a,b}
计算图像中像素的显著值,并将其采用下面公式映射到[0,255]:
其中pmax和pmin分别为图像所有像素中最大和最小的显著值;
其中,在本步骤中所述的“RGB颜色空间”,是指由红色、绿色以及蓝色的强度表示图像,“XYZ颜色空间”为由三色刺激值表示图像,“Lab颜色空间”,是指由亮度值、从纯黑到纯白的强度、从黄色到蓝色的强度来表示图像。
2.根据权利要求1所述的一种基于人脚图像的脚型分类方法,其特征在于:在步骤三中所述的“种子填充的方法”,详述如下:
从脚掌区域中的一个孔洞内点开始,通过上、下、左、右四个方向由内向外逐个像素地用黑色填充直到遇到白色边界为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510329437.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序