[发明专利]基于条件随机场图结构学习的语义图像分割方法有效
申请号: | 201711429655.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108305266B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 王振华;丁福光;郭东岩;张剑华;刘盛;陈胜勇 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06T7/143 | 分类号: | G06T7/143;G06T7/10;G06N3/08;G06N3/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于条件随机场图结构学习的语义图像分割的方法,所述方法包括以下步骤:1)训练一个全卷积神经网络或是采用现成的全卷积神经网络来进行语义图像粗分割;2)使用rcf神经网络学习条件随机场图结构;3)采用学习得到的图结构来训练条件随机场模型参数;使用训练得到的条件随机场模型做语义图像细分割,过程如下:解决最大后验MAP推理问题,通过调用alpha‑beta扩展例程来找到x的最优标签。本发明提供一种分割效果较好的基于条件随机场图结构学习的语义图像分割的方法。 | ||
搜索关键词: | 基于 条件 随机 结构 学习 语义 图像 分割 方法 | ||
【主权项】:
1.一种基于条件随机场图结构学习的语义图像分割的方法,其特征在于,所述方法包括以下步骤:1)训练一个全卷积神经网络或是采用现成的全卷积神经网络来进行语义图像粗分割;2)使用rcf神经网络学习条件随机场图结构,过程如下:对于图像中的每个像素,考虑在四个方向与其邻居的连接,四个方向是指左,上,左上和右上方,对于每个方向,训练一个卷积神经网络,通过微调rcf网络模型来估计该方向上的连接;获得了四个网络,它们在四个方向覆盖相邻像素的连通性,每个网络的输出给出连接存在于相应方向的概率;给定四个网络的输出,首先对图像进行图像处理以获得超像素,然后采用这些超像素来构建CRF模型,对于彼此相邻的每一对超像素(k,l),考虑在8个方向上的所有它们的相邻像素,由集合Ak,l={(i,j)|i∈k,j∈l,i is j’s 8‑ncighbor},对于(i,j)∈Ak,l,令pi,j表示相应网络的输出,定义:这给出了每个CRF图中两个相邻超像素的连通性的评估,eu,v∈{0,1}表示(u,v)之间的边存在(eu,v=1)或不存在(eu,v=0),建立CRF图根据这里δ是一个常量,通过交叉验证来确定;融合四个网络的输出并获得超像素级的CRF图;3)采用学习得到的图结构来训练条件随机场模型参数,过程如下:让z表示任意图像,x表示图像中所有超像素的标签,让xi∈χ是第i个超像素的标签,令G=(V,E)表示学习图,其中V={1,...,n}是在n个超像素集合,并且给定输入z和图结构E,x的概率分布函数PDF由下式给出:其中w=[wu,wp1,wp2,wc]是该分布要学习的参数,wc∈Rl(l=|χ|×(|χ|+1)/2),1(xi,xj)是相对于标签xi,xj的一个指标向量,并且该向量除了由(xi,xj)索引的那个之外的所有位置都取0,N(z,w)是分区函数:公式(3)中的四个项,pi(xi)是根据观测值z来衡量的,第i个超像素取标签xi,用softmax输出层训练一个深度神经网络,由于网络输出像素方向概率,通过平均由这个超像素包围的所有像素的概率来计算pi(xi);Potts模型h1(xi,xj,z),h2(xi,xj,z)被定义为:c,l表示超像素的颜色矢量和位置矢量;最后一项是参数向量wc和指标向量1(xi,xj)之间的点积;训练:给定一个训练集,通过伪对数似然估计估计所有的模型参数,规则化的负伪对数似然代替了PDF表达式(3)的对数似然性;有以下近似值:其中Ω(i)表示在G中与节点i相邻的所有节点,xi的条件PDF是这里分区函数由以下得出:其中是联合特征向量的形式从以下得出:用梯度下降策略训练模型参数;4)使用训练得到的条件随机场模型做语义图像细分割,过程如下:解决最大后验MAP推理问题,即:通过调用alpha‑beta扩展例程来找到x的最优标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711429655.0/,转载请声明来源钻瓜专利网。