[发明专利]压缩图像处理方法、装置、电子设备及计算机可读介质有效
申请号: | 201710974261.7 | 申请日: | 2017-10-18 |
公开(公告)号: | CN107578453B | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 周舒畅;邹雨恒 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 宋南 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩 图像 处理 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种压缩图像处理方法,其特征在于,所述方法包括:
获取原始图像,所述原始图像的格式为JPEG格式;
将所述原始图像进行熵解码和反量化处理,得到预处理的图像;
利用所述预处理的图像进行神经网络算法训练,得到所述预处理的图像的神经网络的参数;
通过所述预处理的图像的神经网络的参数对所述原始图像进行推断,从而得到推断结果;所述推断结果包括图片的分类结果、图片检测框和图片语义分割热力图;
其中,所述利用所述预处理的图像进行神经网络算法训练,得到所述预处理的图像的神经网络的参数的步骤,包括:
将反离散余弦变换、反缩减取样和色彩空间转换的步骤合并到神经网络的卷积层中进行训练,得到预处理的图像的神经网络参数;
所述利用所述预处理的图像进行神经网络算法训练,得到所述预处理的图像的神经网络的参数包括,重复执行以下处理,直至达到第一预设条件:
确定神经网络模型,并根据所述神经网络模型构建计算图;
将所述计算图通过后向传播计算每个层的参数的梯度;
将每个所述层的参数的梯度和学习率通过梯度下降法更新每个所述层的参数,从而得到所述预处理的图像的所述神经网络的参数;其中,所述神经网络的参数包括卷积层的参数、池化层的参数和全连接层的参数;
其中,所述第一预设条件包括为准确率达到预设阈值或者循环次数达到预设频次。
2.根据权利要求1所述的压缩图像处理方法,其特征在于,将所述计算图通过后向传播计算每个层的参数的梯度,包括:
将所述预处理的图像输入到所述神经网络模型中,得到所述神经网络中每个所述层的参数;
将所述计算图通过后向传播计算所述神经网络中每个所述层的参数的梯度。
3.根据权利要求2所述的压缩图像处理方法,其特征在于,所述将每个所述层的参数的梯度和学习率通过梯度下降法更新每个所述层的参数,从而得到所述预处理的图像的所述神经网络的参数,包括:
获取不同的任务;
根据所述不同的任务的属性确定对应的学习率;
从所述对应的学习率中选取满足第二预设条件的学习率;
将所述神经网络中每个所述层的参数的梯度和满足所述第二预设条件的学习率通过所述梯度下降法更新所述神经网络中每个所述层的参数,得到所述预处理的图像的所述神经网络的参数;
其中,所述第二预设条件包括为所述准确率达到预设阈值。
4.根据权利要求3所述的压缩图像处理方法,其特征在于,所述任务的属性包括类别和数据集,所述根据所述不同的任务的属性确定对应的学习率包括:
根据不同的所述类别和所述数据集确定所述对应的学习率。
5.一种压缩图像处理装置,其特征在于,所述装置包括:
获取模块,用于获取原始图像,所述原始图像的格式为JPEG格式;
处理模块,用于将所述原始图像进行熵解码和反量化处理,得到预处理的图像;
训练模块,用于利用所述预处理的图像进行神经网络算法训练,得到所述预处理的图像的神经网络的参数;
推断模块,用于通过所述预处理的图像的神经网络的参数对所述原始图像进行推断,从而得到推断结果;所述推断结果包括图片的分类结果、图片检测框和图片语义分割热力图;
其中,所述利用所述预处理的图像进行神经网络算法训练,得到所述预处理的图像的神经网络的参数的步骤,包括:
将反离散余弦变换、反缩减取样和色彩空间转换的步骤合并到神经网络的卷积层中进行训练,得到预处理的图像的神经网络参数;
所述训练模块包括,重复执行以下处理,直至达到第一预设条件:
构建单元,用于确定神经网络模型,并根据所述神经网络模型构建计算图;
第一计算单元,用于将所述计算图通过后向传播计算每个层的参数的梯度;
第一更新单元,用于将每个所述层的参数的梯度和学习率通过梯度下降法更新每个所述层的参数,从而得到所述预处理的图像的所述神经网络的参数;其中,所述神经网络的参数包括卷积层的参数、池化层的参数和全连接层的参数;
其中,所述第一预设条件包括为准确率达到预设阈值或者循环次数达到预设频次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710974261.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序