[发明专利]基于深度学习和水平集的人脸分割方法有效
申请号: | 201710252894.7 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107424153B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 赵骥;师云秋 | 申请(专利权)人: | 辽宁科技大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T7/30 |
代理公司: | 沈阳亚泰专利商标代理有限公司 21107 | 代理人: | 史力伏 |
地址: | 114051 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度学习和水平集的人脸分割方法,解决现有技术存在的针对背景过于复杂或者灰度不均匀的人脸图像,人脸分割算法执行效果不理想的问题。基于人脸形状的多样性和复杂性、人脸图像轮廓边界模糊以及背景复杂等特点,在图像分割模型中引入深度学习的方法,使用玻尔兹曼机来学习人脸样本的形状信息,然后将形状信息引入到采用变分水平集和高斯分布拟合表达的能量模型中,实现人脸的快速、准确分割。所建立的人脸分割方法,具有效率高、准确度高和鲁棒性强的特点;能够减少过分割和欠分割现象,匹配速度快,可进行实时高效分割。 | ||
搜索关键词: | 基于 深度 学习 水平 分割 方法 | ||
【主权项】:
一种基于深度学习和水平集方法的人脸分割技术,其特征在于:包括如下步骤:步骤一、使用深度学习模型,来学习样本形状,为构造水平集的先验形状奠定基础,并且使图像分割模型能够适用于任意先验形状;深度学习模型采用的是深度玻尔兹曼机,由多层受限制玻尔兹曼机叠加而成,在深度学习模型中各单元层之间均为无向连接,把以前深度学习模型中复杂的上下层的反馈系数训练简单化,从而使得深度玻尔兹曼机深度学习模型有了强大的数据泛化能力,使得其性能优于其它深度学习模型;在深度玻尔兹曼机的基础上,通过深度玻尔兹曼机学习目标形状样本,从而生成形状模板,模型如下:EDBM(v,h1,h2;θ)=-vTW1v1-h1TW2h2-a1Th1-a2Th2-bTv]]>其中v是可见单元,h是隐单元,W是权值矩阵,a和b是参数;步骤二、构造去均值平均绝对差度量进行形状匹配,该算法能够使每一个图像的像素值都被充分利用,算法的优点在于通过在运算中减掉均值从而减轻了自相关运算时因为数值接近而造成的匹配失败;比较两幅图像对应点的像素值的去均值平均绝对差,若这个去均值绝对差的值小于0.10,就认为这两点相似,形状库中与待分割图像相似点最多的形状就是待分割目标的匹配形状;该匹配算法实现较为方便,精度较为准确,运算复杂度适中;对于部分遮挡的图像也可以得到理想的分割效果;并且还利用匹配到的形状模板得到活动轮廓的初始轮廓线,以便于轮廓曲线更加贴近目标边界,并使其向感兴趣的区域收敛,提高分割方法的分割效率和分割准确率;所述采用的去均值平均绝对差度量来进行形状匹配,模型如下:D(u,v)=1m×nΣj=1mΣk=1nX(j+u,k+v)-X(u,v)‾-Y(j,k)+Y‾2]]>其中,为基准图的平均值,为实时图的平均值;步骤三、根据深度玻尔兹曼机学习得到的先验形状,建立新的形状能量项;在深度玻尔兹曼机深度学习模型中,三层的学习结构能够有效地表达形状样本的形状结构;在三层学习结构的最底层能够检测到样本形状的局部特征,并将这些局部特征向上一层传递,使得上一层能够检测到更加复杂的样本形状特征,即样本形状的全局形状特征;再通过条件概率推理可以产生出一个先验形状;由于深度玻尔兹曼机深度学习模型生成的先验形状是由概率表示的,因此,形状的表示就由原来的二维矩阵v的表示方式替换为由概率定义的形状P的表示方式;其中,P:Ω→[0,1];这样,先验形状的形状能量项就可以表示为:EDBM‑Shape(pi)=EDBM(pi,h1,h2;θ)步骤四、使用局部高斯分布来描述图像的全局信息,构建新的图像能量项;使用具有不同均值和方差的高斯分布来描述局部图像能量强度;能量最小化的过程就是通过一个交错的水平集演化,并估计在一个迭代过程中局部能量均值和方差,由局部能量的均值和方差构成空间变化函数来处理强度的不均匀性和空间变化的强度噪声,还能够分割具有相似的强度而有不同的方差的区域,模型如下:Eimage=ELGDF(φ,u1(x),u2(x),σ1(x)2,σ2(x)2)=∫ΩϵxLGDF(φ,u1(x),u2(x),σ1(x)2,σ2(x)2)dx+μ∫Ω12(|▿φ(x)|-1)2dx+v∫ΩH(φ(x,y))dxdy]]>其中,是局部拟合能量泛函,是平滑项,∫ΩH(φ(x,y))dxdy是正则项,惩罚水平集函数,避免水平集函数重新初始化,μ、ν是参数;步骤五、将新的形状能量项和新的图像能量项整合为一个能量项,并以此能量项来驱动轮廓曲线的演化;将形状能量项和图像能量项线性整合为一个能量项,并以此能量项来驱动轮廓曲线的演化,模型如下:Etotal=(1-λ)ELGDF(φ,u1(x),u2(x),σ1(x)2,σ2(x)2)+λEshape=(1-λ)∫ΩϵxLGDF(φ,u1(x),u2(x),σ1(x)2,σ2(x)2)dx+μ∫Ω12(|▿φ(x)|-1)2dx+v∫ΩH(φ(x,y))dxdy+λ(2δ2φ-EDBM-Shape▿φEDBM-Shape)]]>其中,λ为各项能量项在整合能量项中的权重,且λ>0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁科技大学,未经辽宁科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710252894.7/,转载请声明来源钻瓜专利网。
- 上一篇:产品视觉自动对位方法
- 下一篇:基于动态分配的分水岭图像分割并行方法