[发明专利]人形图像分割方法有效
申请号: | 201480000254.1 | 申请日: | 2014-05-23 |
公开(公告)号: | CN104067314B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 谭铁牛;黄永祯;王亮;吴子丰 | 申请(专利权)人: | 银河水滴科技(北京)有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 宋宝库 |
地址: | 100090 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人形 图像 分割 方法 | ||
技术领域
本发明涉及模式识别领域,尤其涉及一种基于多尺度上下文深度学习的人形图像分割方法。
背景技术
在图像目标分割方法中,现有的分割方法是建立每一个像素点与其临近像素点的关系,并采用图模型来建模该关系。当邻近像素点个数太少时(例如基于图模型的方法考虑邻近几个或十几个像素点),则无法形成有语义的分割;而当考虑的邻近像素点个数较多时,计算复杂度非常高,而且很可能模型难以收敛。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种人形图像分割方法,采用人形区域内像素点的多尺度上下文信息来表达人形目标;通过多通道深度学习网络来描述人形局部区域的不同尺度上下文信息。
为实现上述目的,本发明提供了一种人形图像分割方法,所述方法包括:
步骤S1,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
步骤S2,将所有所述第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
步骤S3,采用反向传播算法来训练所述神经网络群,得到人形图像分割训练模型数据;
步骤S4,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
步骤S5,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
进一步的,所述步骤S1具体包括:对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
进一步的,所述步骤S2中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
进一步的,所述步骤S4具体包括:对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块。
本发明人形图像分割方法,图像分割速度快,精确度高。
附图说明
图1为本发明人形图像分割方法的流程图;
图2为本发明人形图像分割方法的示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
深度学习理论是在语音识别、图像目标分类与检测等领域都取得了非常好的结果。并且基于该理论的技术很容易被扩展成不同类型的应用。
一种基于多尺度上下文深度学习的人形图像分割方法采用深度学习技术来描述每一个像素点与周围大范围像素点(可以超过一万个像素点)的关系,并且采用卷积神经网络来建模这些关系,取得了非常好的人形图像分割结果。
图1为本发明人形图像分割方法的流程图,如图所示,本发明具体包括如下步骤:
步骤101,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
具体的,对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
步骤102,将所有第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
因为第一像素点可能有多个,而每一个第一像素点提取的图像块的尺度也会不同,在将图像块送入卷积神经网络的时候,因为每一个通道对应一个尺度的图像块,所以每一个通道对应的图像块的尺度也不同,而进入该通道的图像块的尺度是相同的。
步骤102中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银河水滴科技(北京)有限公司,未经银河水滴科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480000254.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序