[发明专利]一种基于稀疏样本的视频压缩方法在审
申请号: | 202010372156.8 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111565318A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 郑志浩;姚远;张学睿;张帆;尚明生 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/85;H04N7/18;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 样本 视频压缩 方法 | ||
本发明涉及一种基于稀疏样本的视频压缩方法,属于视频压缩技术领域。该方法包括:S1:数据预处理;S2:首先通过变分自编码器与生成对抗网络结合的视频生成方法,利用变分自编码器对数据集中视频的每一帧进行学习,构建具有良好连续性的隐空间,隐空间中的每一点对应视频中的一帧;然后将噪声与文本输入生成对抗网络的生成器,生成器则生成潜变量空间中的多个相关联的点,最后通过变分自编码器的解码器生成连续图像;S3:将生成的连续图像输入视频压缩模型,通过CNN网络筛选背景帧,然后使用YOLO神经网络对每一帧图像当中的目标进行识别。本发明能够提高视频压缩效率,同时减少网络传输时延和本地资源的消耗。
技术领域
本发明属于视频压缩技术领域,涉及一种基于稀疏样本的视频压缩方法。
背景技术
视频压缩技术常用于视频数据的传输、保存等,在日常生活中常有应用。视频监控成为越来越流行,随之带来的是海量的视频存储,因此视频压缩成为一个需求非常强烈的技术,视频压缩也成为了视频监控领域的研究热点。随着人工智能技术快速发展,尤其是深度学习的已经成功的应用到很多领域中,例如图像识别、语音识别、NLP和目标检测等领域中。因此可以考虑利用深度学习到视频压缩,来实现更高效的视频压缩。然而一个健壮的视频压缩神经网络通常需要大量的训练数据进行长期的训练才能成型,训练数据的采集制作需要长期且大量的人员、设备、时间投入,增加项目的研发成本,也使得模型的计算复杂性很高。因此需要在保证模型质量的前提下,减小数据集的采集难度和体量,确保视频压缩模型既能保证原视频的分辨率等信息,又能降低视频的存储代价是目前现有技术中急需解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于稀疏样本的视频压缩方法,提高视频压缩效率的同时,减少网络传输时延和本地资源的消耗。
为达到上述目的,本发明提供如下技术方案:
一种基于稀疏样本的视频压缩方法,具体包括以下步骤:
S1:数据预处理;
S2:构建训练稀疏视频样本扩充模型,首先通过变分自编码器与生成对抗网络结合的视频生成方法,利用变分自编码器对数据集中视频的每一帧进行学习,构建具有良好连续性的隐空间,隐空间中的每一点对应视频中的一帧;然后将噪声与文本输入生成对抗网络的生成器,生成器则生成潜变量空间中的多个相关联的点,最后将这些相关联的点通过变分自编码器的解码器生成多帧相关联连续图像,这些图像组成所要生成的视频;
S3:构建训练视频压缩网络模型,并将生成的连续图像输入视频压缩模型,通过CNN网络进行背景帧的筛选,然后使用基于卷积神经网络的YOLO神经网络对每一帧图像当中的目标进行识别,并保存识别信息,即为压缩视频。
进一步,步骤S1中,所述数据预处理具体包括:针对少量采集视频,先将视频文件做音频抽离处理,得到“视频-音频”数据,对收集的视频及音频数据做归一化处理,得到生成对抗网络训练过程中使用的数据集;并将视频按帧分割,对分割得到的每一帧图像匹配其原所属视频的音频片段,得到稀疏样本扩充模型的基础数据集。
进一步,步骤S2中,构建的稀疏视频样本扩充模型包括训练变分自编码器和生成对抗网络,模型训练具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010372156.8/2.html,转载请声明来源钻瓜专利网。