[发明专利]利用物体跟踪和历史轨迹全景视频的视口预测方法及系统有效

申请号：	201910525611.0	申请日：	2019-06-18
公开（公告）号：	CN110248178B	公开（公告）日：	2021-11-23
发明（设计）人：	霍永凯;唐金婷;杨少石	申请（专利权）人：	深圳大学
主分类号：	H04N13/344	分类号：	H04N13/344;G06F3/01
代理公司：	重庆市信立达专利代理事务所(普通合伙) 50230	代理人：	包晓静
地址：	518061 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	利用物体跟踪历史轨迹全景视频预测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于全景视频技术领域，公开了一种利用物体跟踪和历史轨迹全景视频的视口预测方法及系统，所述利用物体跟踪和历史轨迹全景视频的视口预测方法包括以下步骤：利用轨迹平移转换解决视口轨迹的不连续情况；利用对全景视频物体跟踪的轨迹模拟观看者兴趣坐标；构建基于深度学习的视口预测模型，预测未来帧的视口轨迹。本发明提出基于深度学习的视口预测方案用于预测视频观看者的视口位置，结合全景视频视口自适应传输方法实现节省带宽，其中历史视口轨迹和物体跟踪轨迹信息联合输入长短期记忆网络进行未来帧的视口轨迹预测。实验结果表明，本发明提出的方案优于基准方案高达33.5％。

技术领域

本发明属于全景视频技术领域，尤其涉及一种利用物体跟踪和历史轨迹全景视频的视口预测方法及系统。

背景技术

全景视频作为一种新型的视频格式，突破了传统的视野范围，将其视野范围扩展到360度全覆盖，实现虚拟现实的沉浸感，因此吸引了大量的关注。全景视频可以用于多种场景，如体育，社交网络，游戏等，同时5G通信的快速突破，Facebook等平台的支持，以及头戴式虚拟现实显示设备(HMD)的大量生产和推广进一步促进全景视频的发展。全景视频克服了视频图像呈现和感知的被动，使得视频的观众成为沉浸在观看场景中的虚拟参与者。每个全景帧在水平和垂直方向上覆盖360°×180°信号的范围。如图2a所示，将平面全景视频信号投影到球面上以实现身临其境的体验，当观看者戴上HMD，360度的视频信号将围绕观看者使得观看者虚拟位于球面视频信号的中心。观看者所见的视频图像区域称为视口，视野范围为60°到110°，通过转动头部或者身体，观看者能自由的选择观看视频图像的内容，视口之外的图像不可见。视口轨迹通常为观看者的兴趣内容，如图2b所示，一段时间内产生的视口轨迹是连续的，观看者选择兴趣的物体并保持兴趣的物体于视口内。由于不同观看者的兴趣不同，他们在同一视频帧中会产生不同的视口选择。如图3所示，全景视频内容呈现在球面上，两个观看者在观看同一帧图像时，感兴趣兴趣物体不一致，视口中心位于不同的坐标，因此，所看到的图像内容也不一样，视口范围外的图像对观看者不可见。在视频网络传输过程中，为满足所有观看者对不同视口的需求。网络上传输完整的视频图像内容，而可见的视口图像信号只占用完整球面的信号的一小部分，因此，不可见的图像信号占用了大量的带宽资源。假设观看者将来时段的视口轨迹已知，则可以根据观看者需求选择对应的视口图像传输，有利于视口自适应地分配带宽资源，使得观看者观看的视频质量和用户体验效果更好。本发明为更好地实现全景视频视口自适应传输，提出了一种方法预测将来时段的视口轨迹。

目前已有许多针对全景视频的研究，从投影、压缩、视口自适应传输和虚拟摄像等。

·投影：等量矩形投影(equirectangular)为最通用的投影方式，其转化公式直接简明，但图像有较大的形变，球面图像两极占用较大的编码，赤道相对较少。通常图像的关键内容分布在球面赤道，立方体(cube)投影改善了编码的分布，使得赤道和两极编码分布更加均匀，它将球面的视频图像映射到等六面体中，使得每个面都没有形变。此外，Facebook提出使用椎体投影进一步提高图像质量。

·压缩：为提高观看者兴趣区域(RoI)的质量，许多研究提出了基于H.265和HEVC的视频流算法。

·视口自适应传输：为了节省带宽，在本发明中提出了基于视口自适应的视频分配方案。根据视口的位置，自适应传输可以为视口内的图像分配更多的带宽，视口外的图像分配较少的带宽，甚至距离视口较远的图像区域不分配带宽。通过不同图像区域不同权重的带宽分配从而实现更少的带宽消耗，对于观看者的视口图像质量更高，节省带宽的同时提高了观看者的观看体验。另一方面，基于“块”的自适应视频传输能更好地与HTTP和DASH协议整合。

·虚拟摄影：虚拟摄影指从全景视频中模拟专业的摄影师选择符合人们观看视角的图像内容，将全景视频中采样的多个视角连接在一起组成平滑的观看视角轨迹。其主要思想是在全景帧中找到吸引观看者注意力的区域，利用显著图、光流图和前段时间的视角位置，计算下一个视角位置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳大学，未经深圳大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910525611.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种图像数据的处理方法及装置
下一篇：基于光场编码的相机光瞳像差校正方法

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N13-00 立体电视系统；其零部件
H04N13-02 .图像信号发生器
H04N13-04 .图像重现装置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]利用物体跟踪和历史轨迹全景视频的视口预测方法及系统有效

专利文献下载