[发明专利]图像处理方法及装置、神经网络的训练方法、存储介质有效
申请号: | 202010010385.5 | 申请日: | 2020-01-06 |
公开(公告)号: | CN113076966B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 刘鼎;江亦凡;沈晓辉;方晨;杨建朝 | 申请(专利权)人: | 字节跳动有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/44;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 神经网络 训练 存储 介质 | ||
一种基于神经网络的图像处理方法、图像处理装置、神经网络的训练方法以及存储介质。该神经网络包括循环解析网络、合成网络和叠加网络,该图像处理方法包括:使用神经网络对输入图像进行处理,以得到输出图像。循环解析网络的处理包括多个层级的逐层嵌套的解析处理;除了最后一个层级的解析处理外,每个层级的解析处理包括编码处理、池化处理、标准上采样处理和解码处理;下一层级的解析处理嵌套在上一层级的池化处理和标准上采样处理之间;最后一个层级的解析处理包括:多尺度池化处理和与之对应的多尺度上采样处理,以提取特征图像的不同区域范围的特征信息,用于对输入图像的不同区域进行自适应亮度调整。
技术领域
本公开的实施例涉及一种基于神经网络的图像处理方法、图像处理装置、神经网络的训练方法以及存储介质。
背景技术
当前,基于人工神经网络的深度学习技术已经在诸如图像分类、图像捕获和搜索、面部识别、年龄和语音识别等领域取得了巨大进展。深度学习的优势在于可以利用通用的结构以相对类似的系统解决非常不同的技术问题。卷积神经网络(Convolutional NeuralNetwork,CNN)是近年发展起来并引起广泛重视的一种人工神经网络,CNN是一种特殊的图像识别方式,属于非常有效的带有前向反馈的网络。现在,CNN的应用范围已经不仅仅限于图像识别领域,也可以应用在人脸识别、文字识别、图像处理等应用方向。
发明内容
本公开至少一个实施例提供一种基于神经网络的图像处理方法,其中,所述神经网络包括循环解析网络、合成网络和叠加网络,所述图像处理方法包括:获取输入图像;使用所述循环解析网络对所述输入图像进行循环解析处理,以得到中间特征图像;使用所述合成网络对所述中间特征图像进行合成处理,以得到中间输出图像;以及使用所述叠加网络对所述中间输出图像与所述输入图像进行对位相加处理,以得到输出图像;其中,所述循环解析网络的所述循环解析处理包括:N个层级的逐层嵌套的解析处理;除了第N层级的解析处理外,其余每个层级的解析处理包括编码处理、池化处理、标准上采样处理和解码处理;第i+1层级的解析处理嵌套在第i层级的池化处理和第i层级的标准上采样处理之间;第i层级的解析处理的输入作为第i层级的编码处理的输入,第i层级的编码处理的输出作为第i层级的池化处理的输入,第i层级的池化处理的输出作为第i+1层级的解析处理的输入,第i+1层级的解析处理的输出作为第i层级的标准上采样处理的输入,第i层级的编码处理的输出和第i层级的标准上采样处理的输出经过拼接处理后作为第i层级的解码处理的输入,第i层级的解码处理的输出作为第i层级的解析处理的输出;所述输入图像作为第1层级的解析处理的输入,第1层级的解析处理的输出作为所述中间特征图像;第N层级的解析处理包括:对第N层级的解析处理的输入进行编码处理,以得到第一特征图像;基于所述第一特征图像,进行多尺度池化处理和与所述多尺度池化处理对应的多尺度上采样处理,以得到多个第二特征图像,其中,所述多个第二特征图像的尺寸大小与所述第一特征图像的尺寸大小相同;将所述第一特征图像与所述多个第二特征图像进行拼接,以得到第三特征图像;以及,基于所述第三特征图像,得到第N层级的解析处理的输出;其中,N、i均为整数,且N≥2,1≤i≤N-1。
例如,在本公开一些实施例提供的图像处理方法中,基于所述第一特征图像,进行所述多尺度池化处理和与所述多尺度池化处理对应的所述多尺度上采样处理,以得到所述多个第二特征图像,包括:对所述第一特征图像进行所述多尺度池化处理,以得到多种尺度的第四特征图像;分别对所述多种尺度的第四特征图像进行降维处理,以得到多种尺度的第五特征图像;对所述多种尺度的第五特征图像进行所述多尺度上采样处理,以得到具有相同尺度的所述多个第二特征图像。
例如,在本公开一些实施例提供的图像处理方法中,基于所述第三特征图像,得到所述第N层级的解析处理的输出,包括:对所述第三特征图像进行解码处理,以得到所述第N层级的解析处理的输出;或者,将所述第三特征图像作为所述第N层级的解析处理的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于字节跳动有限公司,未经字节跳动有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010385.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序