[发明专利]一种用于深度学习编码的跨平台熵编码方法及解码方法在审
申请号: | 202010727133.4 | 申请日: | 2020-07-26 |
公开(公告)号: | CN112019865A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 王培;其他发明人请求不公开姓名 | 申请(专利权)人: | 杭州皮克皮克科技有限公司 |
主分类号: | H04N19/91 | 分类号: | H04N19/91;H04N19/85 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 310018 浙江省杭州市杭州经济技术开发区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 深度 学习 编码 平台 方法 解码 | ||
本发明公开了一种用于深度学习编码的跨平台熵编码方法及解码方法,包括:确定计算基于深度学习编码的熵编码模型的网络模块;将网络模块中的模型参数替换为精度大于等于float64的浮点数的模型参数,并将其中计算所用的中间变量也替换为精度大于等于float64的浮点数的中间变量;载入训练好的模型参数,对基于深度学习编码的熵编码模型进行初始化。通过本发明,可以跨平台使用,且不需要重新设计,重新训练模型参数,可以直接应用于他们的部署,而不会导致性能及效率的下降。
技术领域
本发明涉及图像编码技术领域,特别涉及一种用于深度学习编码的跨平台熵编码方法及解码方法。
背景技术
近年来,基于深度学习的图像压缩方法引起了很多研究者的关注。研究人员已经这个研究方向已经取得了很多成果。比如2016年Toderici等人提出了一种基于循环卷积神经网络的图像压缩框架,取得了超越目前最常用的传统编码器JPEG的压缩性能,这是基于学习的方法第一次超越传统方法。2018年,另一个基于卷积神经网络的编码框架,取得了超越当时最好的传统编码方法BPG的性能。这些成果充分表明基于深度学些的图像编码方法拥有巨大的潜力。
基于深度学习编码方法的框架本质上和传统编码框架类似,由正变换,量化,熵编码,反变换等模块组成。其中各个模块都是由卷积操作组成。这些卷积层的参数在最小化率失真损失时,可以联合优化,直到达到一个最优解。
在实际应用时,需要将正变换后的图像表征进行熵编码,得到二进制的码流,进行存储或传输。当使用基于超先验的熵编码方法时,需要先得到熵编码模型。熵编码模型用来对图像表征进行熵编码,在编码端和解码端使用的熵编码模型必须一模一样,才能正确解码二进制码流,否则熵解码会失败,导致整个图像解码过程失败。
在使用基于深度学习的图像编解码方法时,由于不同平台的计算方式,加速策略等不同,导致解码端解码得到的熵模型和编码端不能完全一致,从而使得解码过程有很大概率失败。这个问题极大阻碍了基于深度学习图像编码的实际应用,因为编码解往往运行在不同设备上,而编解码平台通常是不一样的,比如,在CPU上编码,GPU上解码;GPU上编码,另一个GPU上解码等等场景,都会有很大概率会解码失败。
传统的熵编码方法一般是使用整数形式进行计算,得到的熵编码模型在各个平台上是一致的。但是在深度学习编码这一新兴的编码框架下,计算熵编码模型一般使用浮点数,比如采用常见的深度学习框架Tensorflow或者Pytorch,模型参数和运算使用的临时变量都是默认采用32位浮点数。由于32位浮点数表示的精度有限,而不同平台的浮点数运算实现在误差允许范围内会有微弱的差别,该差别低于精度要求不高的应用没有显著影响,但是对于计算熵编码模型,万分之一的误差都会导致熵解码失败,从而使整个解码过程无效。去年,Google的Ballé等人提出了一种整数深度神经网络的方法来解决这个问题。该方法可以有效的解决编解码端计算熵编码模型精度不同的问题,但是该方法的缺点在于需要重新设计网络,重新训练网络,对于现有已经训练好的模型不适用。
发明内容
本发明针对上述现有技术中存在的问题,提出一种用于深度学习编码的跨平台熵编码方法及解码方法,可以部署在不同平台上,跨平台使用,并且不需要重新设计,重新训练模型参数,可以直接应用于他们的部署,而不会导致性能及效率的下降。
为解决上述技术问题,本发明是通过如下技术方案实现的:
本发明提供一种用于深度学习编码的跨平台熵编码方法,其包括以下步骤:
S11:确定计算基于深度学习编码的熵编码模型的网络模块;
S12:将所述S11中的网络模块中的模型参数替换为精度大于等于float64的浮点数的模型参数,并将其中计算所用的中间变量也替换为精度大于等于float64的浮点数的中间变量;
S13:载入训练好的模型参数,对基于深度学习编码的熵编码模型进行初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州皮克皮克科技有限公司,未经杭州皮克皮克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010727133.4/2.html,转载请声明来源钻瓜专利网。