[发明专利]基于深度学习模型视频数据传输方法、系统、介质及设备有效
申请号: | 202011373854.6 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112565777B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 罗静;张赛;张培;刘锋 | 申请(专利权)人: | 通号智慧城市研究设计院有限公司 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/44;H04N19/124;G06N3/0475;G06N3/094 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 孙楠 |
地址: | 100070 北京市丰台区汽*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 模型 视频 数据传输 方法 系统 介质 设备 | ||
1.一种基于深度学习模型的视频数据传输方法,其特征在于,包括以下步骤:
利用训练好的深度学习的网络模型对视频流的图像数据进行压缩;
将压缩后的每一帧图像进行实时网络传输,发送至视频数据接收端;
在接收端进行反向图像恢复还原,并将还原后的图像数据发送给接受者;
所述深度学习的网络模型采用基于对抗生成网络的深度学习模型;
在对抗生成网络中,采用选择性生成压缩方法对视频数据进行压缩;
采用选择性生成压缩方法对对抗生成网络在视频压缩和复原包括以下步骤:
将训练图片传输至图像编码器,经图像编码器进行压缩;
将训练图片的不同区域用不同灰度值表示得到灰度图片,将灰度图片传输至图像编码器和判别器;
将压缩后的图像ω经量化器q进行量化处理;
将量化处理后的图像数据与从灰度图片中提取的下采样特征相结合,结合后传输至判别器;
判别器根据接收到的数据进行逆序还原,生成解压缩重构图片。
2.如权利要求1所述传输方法,其特征在于,以生成器、辨别器和编码器为一个整体,其目标函数为:
式中,目标函数包含了三部分,前两个式子是对抗生成网络的目标函数第三个式子λE[d(x,G(z))]是控制生成图片相对于原始图片的失真程度,最后一个式子可以通过调整β的大小来调整压缩率;E为图像编码器;D为判别器;z为生成器的图像训练集,函数f(·)=log(·),函数g(·)=log(1-·),d(·)为二范数,λ为控制生成器生成图像与原训练图片x的失真率,β为控制压缩程度的参数,为压缩函数熵的可微模型,G为生成器。
3.如权利要求1所述传输方法,其特征在于,所述对抗生成网络深度学习模型的训练包括以下步骤:
S11、建立初始判别神经网络和初始生成神经网络,并将初始判别神经网络和初始生成的神经网络组成为初始的对抗生成神经网络;
S12、初始化初始对抗生成神经网络的参数和初始判别神经网络的边界向量;
S13、获取真实样本集合和随机变量集合,并将随机变量集合输入到初始生成神经网络中,依次生成需要的假样本集合;
S14、将真实样本集合和假样本集合输入到初始判别的神经网络,以得到与真实样本集合的第一判别输出和与假样本集合对应的第二判别输出;
S15、根据预设的判别损失函数对第一判别输出和第二判别输出进行计算以得到判别损失值;
S16、根据预设的生成损失函数对第二判别输出进行计算以得到生成损失值;
S17、根据判别损失值和损失值对初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
4.如权利要求1所述传输方法,其特征在于,所述接收端对接收到的视频进行反向图像恢复还原的方法为:将压缩图像作为一个噪声,该噪声满足正态分布、均匀分布或任意分布;将压缩的图像输入到训练好的深度学习的网络模型,深度学习的网络模型将输入图片的分布以预先设定的形式与真实分布进行损失训练,即最小化生成分布和真实分布的距离,减小生成分布与真实分布之间的JS散度,通过JS散度度量两个概率分布的相似度,进而还原恢复低分辨率的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通号智慧城市研究设计院有限公司,未经通号智慧城市研究设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011373854.6/1.html,转载请声明来源钻瓜专利网。