[发明专利]图像语义分割方法和装置、神经网络训练方法和装置在审
申请号: | 201710827797.6 | 申请日: | 2017-09-14 |
公开(公告)号: | CN108876790A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 邹雨恒;周舒畅;周昕宇;冯迭乔 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/38;G06K9/62;G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和装置 图像语义 神经网络 分割 图像 计算节点 中间表示 输入层 中间层 计算机可读存储介质 神经网络训练 二值化处理 输出层输出 卷积计算 数据执行 语义类别 输出层 图表示 卷积 像素 热力 | ||
本公开提供了一种基于神经网络的图像语义分割方法和装置、用于图像语义分割的神经网络的训练方法和装置、以及计算机可读存储介质。所述神经网络包括输入层、中间层和输出层。所述图像语义分割方法包括:获取待分割的图像;经由所述输入层输入所述图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对获得的所述中间表示执行二值化处理;以及经由所述输出层输出所述图像的热力图,所述热力图表示所述图像中每个像素所属的语义类别。
技术领域
本公开涉及图像处理领域,更具体地,本公开涉及基于神经网络的图像语义分割方法和装置、用于图像语义分割的神经网络的训练方法和装置、以及计算机可读存储介质。
背景技术
神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测,图像语义分割,物体检测,动作追踪,自然语言翻译等。神经网络已被人工智能界广泛应用。
在利用神经网络进行图像语义分割的任务中,与只输出一个类别的普通分类网络不同,语义分割任务中使用的神经网络需要输出一个与原始图像大小相同的热力图。因此,利用神经网络进行图像语义分割的任务需要占用大量的计算和存储资源。在诸如移动设备这样计算和存储资源有限的应用平台上,利用神经网络进行图像语义分割的任务将导致长延时、功耗和发热量增加,从而使得用户体验劣化。
发明内容
鉴于上述问题而提出了本公开。本公开提供了一种基于神经网络的图像语义分割方法和装置、用于图像语义分割的神经网络的训练方法和装置、以及计算机可读存储介质。
根据本公开的一个方面,提供了一种基于神经网络的图像语义分割方法,其中,所述神经网络包括输入层、中间层和输出层,所述图像语义分割方法包括:获取待分割的图像;经由所述输入层输入所述图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对获得的所述中间表示执行二值化处理;以及经由所述输出层输出所述图像的热力图,所述热力图表示所述图像中每个像素所属的语义类别。
根据本公开的另一个方面,提供了一种用于图像语义分割的神经网络的训练方法,其中,所述神经网络包括输入层、中间层和输出层,所述训练方法包括:经由所述输入层输入训练图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对至少一个计算节点的中间表示执行二值化处理;经由所述输出层输出训练结果,所述训练结果包括所述训练图像的热力图;以及在所述神经网络的损失函数满足预定条件时,获得训练好的所述神经网络,在所述神经网络的损失函数不满足预定条件时,继续输入训练图像以重复执行上述训练过程,其中所述神经网络的损失函数是根据所述训练结果确定的。
根据本公开的又一个方面,提供了一种图像语义分割装置,所述图像语义分割装置包括:图像获取模块,用于获取待分割的图像;以及图像语义分割模块,用于采用神经网络对所述图像获取模块获取到的所述图像执行图像语义分割,所述神经网络包括输入层、中间层和输出层,所述图像语义分割模块具体用于:经由所述输入层输入所述图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对获得的所述中间表示执行二值化处理;以及经由所述输出层输出所述图像的热力图,所述热力图表示所述图像中每个像素所属的语义类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710827797.6/2.html,转载请声明来源钻瓜专利网。