[发明专利]显示对象在三维场景中的显示方法及设备在审
申请号: | 201280053273.1 | 申请日: | 2012-04-10 |
公开(公告)号: | CN103931177A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 爱默德·鲍阿齐齐;基奥万尼·科达拉;卢卡斯·康德拉德 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N13/00 | 分类号: | H04N13/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 显示 对象 三维 场景 中的 方法 设备 | ||
技术领域
本发明涉及3D多媒体领域,包括立体3D和多视角3D视频及静止图像。确切地说,本发明涉及用于在3D座标系中操控定时文字和定时图形的平面位置的信令信息。
背景技术
目前,可用的媒体文件格式标准包括ISO基媒体文件格式(ISO/IEC14496-12)、MPEG-4文件格式(ISO/IEC14496-14,也被称为MP4格式)、AVC文件格式(ISO/IEC14496-15)、3GPP文件格式(3GPP TS26.244,也被称为3GP格式),以及DVB文件格式。其中,ISO文件格式是基础,其可衍生出所有上述文件格式(ISO文件格式本身除外)。因此,这些文件格式(包括ISO文件格式本身)也被称作ISO文件格式家族。
图8图示了根据ISO基媒体文件格式的简化文件结构800。ISO基媒体文件格式中的基本构建模块被称为“框(box)”。每个框具有各自的标题栏(header)和负荷。该标题栏指示所属框的类型,并以字节数来指示所属框的大小。单个框也可在其内包含其他框,并且,在ISO文件格式中,规定了在某种类型的单个框内所允许出现的框类型。另外,规定每个文件必须拥有某些类型的框,而其他类型的框则是任选的。而且,对于一些框类型,允许在单个文件中出现一个以上的此类框。由此可知,ISO基媒体文件格式规定了框的层次结构。
根据ISO文件格式家族,文件800由分别包含在独立的框,即媒体数据(mdat)框801和电影(moov)框803中的媒体数据和元数据组成。若想使文件800具有可操作性,则必须使其具有这两种框801、803。电影框803可含有一个或多个轨迹805、807,并且每个轨迹驻留在一个单个轨迹框中。所谓轨迹可为以下类型之一:媒体、提示、时间元数据。媒体轨迹指代根据某一媒体压缩格式,或根据ISO基媒体文件格式对该媒体压缩格式的封装而格式化的样本。提示轨迹指代提示样本,该等提示样本含有作业程序书指令,用于构建可通过所指示的通信协议进行传输的数据包。这些作业程序书指令可含有构建包头部的指导,还包括构建数据包负荷的指导。在数据包负荷构建中,可能引用驻留在其他轨迹或项目中的数据,即,在数据包构建过程期间通过索引来指示需要将特定轨迹或项目中的哪些数据复制到正在构建的数据包。定时元数据轨迹指代用来描述所涉及的媒体及/或提示样本的样本。通常,会选择一个媒体轨迹(例如,视频轨迹805或音频轨迹807)来展示一种媒体类型。轨迹的样本与样本标号暗中关联,每个样本标号会按照所指示的样本解码次序而比前一个样本标号递增1。
注意到,对于在单个文件800中包含展示,ISO基媒体文件格式并不加以限制,而且此类展示可包含在多个文件中。单个文件800还包含用于整体展示的元数据803。该文件800也可包含全部媒体数据801,而媒体数据801自身即为展示。对于其他文件而言(如果使用的话),并不需要将其格式化为ISO基媒体文件格式,也不需要使用其来包含媒体数据,这些其他文件还可含有尚未使用的媒体数据或其他信息。ISO基媒体文件格式仅关注展示文件的结构。媒体数据文件的格式仅受ISO基媒体文件格式或其衍生格式的约束,这是因为媒体文件中的媒体数据的格式化须遵守ISO基媒体文件格式或其衍生格式的规定。
3GPP SA4(第三代移动通信标准化伙伴项目规范制定工作组,服务及系统方面:编解码器)已致力于对3GPP服务的定时文字及定时图形进行研发,研发成果包括定时文字的技术规格TS26.245以及定时图形的技术规格TS26.430。图9图示了在二维(2D)座标系中由3GPP定时文字定义的文字呈现位置及组成的实例图示。定时文字及定时图形这两种格式允许实现在多媒体场景中文字903及图形相对于视频元件905的布置,视频元件905显示在显示区域907中。3GPP定时文字及定时图形构建于所显示的视频905的顶部,并且与视频905的左上角911相关联。区域903的界定是通过提供左上角911的座标(tx,ty)913以及该区域903的宽度/高度915、917来实现。除非被文字样本中的“tbox”覆盖,在其他情况下默认地将文字框901设置在区域903中。然后将框值定义为相对于区域903的顶部位置和左侧位置的相对值919、921。
可使用超文本传输协议(HTTP,RFC2616)将定时文字及定时图形作为文件格式的一部分来下载,或者可通过实时传输协议(RTP,RFC3550)来对定时文字及定时图形进行流式传输。
在技术规范3GPP TS26.245中规定了用于存储定时文字的3GP文件扩展名,在标准RFC4396中规定了RTP负荷格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280053273.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:编码/解码图像的方法和装置
- 下一篇:无线通信网络中用于前导码的系统和方法