[发明专利]用编解码器强制的帧大小进行音频分割有效
申请号: | 201080061488.9 | 申请日: | 2010-12-21 |
公开(公告)号: | CN102713883A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 卡尔文·瑞安·欧文 | 申请(专利权)人: | 艾科星先进科技公司 |
主分类号: | G06F15/16 | 分类号: | G06F15/16 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 刘国伟 |
地址: | 美国科*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编解码器 强制 大小 进行 音频 分割 | ||
技术领域
本发明的实施例涉及在因特网上递送媒体内容的领域;且更具体来说,涉及在不引入边界假象的情况下将媒体内容的音频分割成单独内容文件。
背景技术
因特网正变为用于向最终用户分配媒体内容(例如,视频及音频或音频)及其它信息的主要方法。当前,可将音乐、视频、游戏及其它媒体信息下载到计算机、蜂窝电话及实际上任何具有网络能力的装置。接入因特网以寻找媒体内容的人的百分比正在快速增长。观看者体验的质量是在线视频观看的增长的主要障碍。对在线视频的消费者预期由其电视及电影观看体验设定。
在web上流式传输视频的观众数目正在快速增长,且存在对在因特网上观看视频的正在增长的兴趣及需求。数据文件的流式传输或“流式传输媒体”是指以足以在最初预计的回放速度下向用户呈现顺序媒体内容而不具有显著中断的速率递送所述媒体的技术。不同于媒体文件的经下载数据,经流式传输数据可存储于存储器中直到回放所述数据,且随后接着在已过去规定的时间量之后删除所述数据。
与在空中、在卫星或电缆上的正规广播相比,在因特网上流式传输媒体内容具有一些挑战。在编码媒体内容的音频的背景中出现的一个担忧问题是在将视频及音频分段成固定时间部分时引入边界假象。在一种常规方法中,将音频分段成具有匹配对应视频的固定持续时间的固定持续时间(举例来说,两秒)的若干部分。在此方法中,音频边界始终与视频边界对准。常规方法开始音频编解码器的新编码会话以(举例来说)使用低复杂性高级音频编码(AAC LC)编码每一内容文件的每一音频部分。通过针对音频的每一部分使用新的编码会话,音频编解码器将波形的开头及结尾解释为从零的转变,从而在经编码部分的回放中在部分边界处产生噼噗或咔嗒噪声,例如图1中所图解说明。噼噗或咔嗒噪声称作边界假象。此外,音频编解码器根据编解码器强制的帧大小编码固定持续时间的音频。此还在由音频编解码器产生的样本的数目不能由编解码器强制的帧大小整除时引入边界假象。
图1是图解说明使用常规方法的两个音频部分的示范性音频波形100的图示。音频波形100图解说明视频的第一与第二部分之间从零的转变102。当音频编解码器具有固定帧大小(本文中称作编解码器强制的帧大小)时,经编码的音频要求在所述部分的样本的数目不能由根据编解码器强制的帧大小每帧样本的数目整除时用零填补最后一个帧104。举例来说,当使用48kHz的取样速率时,存在针对两秒的音频段产生的96,000个样本。当将样本的数目96,000除以每帧样本的数目(例如,针对AAC LC为1024个样本且针对高效率AAC (HE AAC)为2048个样本)时,结果为93.75个帧。由于数目93.75并非整数,因此音频编解码器用零填补最后一个帧104。在此实例中,为最后一个帧的最后256个样本赋予零值。虽然零值表示静默音频,但用零填补最后一个帧在音频的经编码部分的回放期间在部分边界处产生噼噗或咔嗒噪声。从零的转变102及最后一个帧中的经填补零104引入边界假象。边界假象的引入可降低音频的总体质量,从而在媒体内容的回放期间影响用户的体验。
另一常规方法尝试通过使用具有较长持续时间以便与帧边界对准的音频部分来限制边界假象的数目。然而,通过使用音频的较大持续时间部分,可需要单独地封装音频及视频。此可呈现流式传输具有音频及视频的媒体内容的缺陷,尤其是在以不同质量等级编码同一媒体内容时,举例来说,所述不同质量等级在允许在媒体内容的回放期间在不同质量等级之间变换的自适应流式传输的背景中使用。
发明内容
附图说明
参考以下说明及附图可最佳地理解本发明,所述附图用于图解说明本发明的实施例。在图式中:
图1是图解说明使用常规方法的两个音频部分的示范性音频波形的图示。
图2是图解说明其中可采用本发明实施例的编码器的计算环境的一个实施例的示意性框图。
图3A是图解说明其中可采用包含多个主机(每一主机均采用图2的编码器)的编码系统的计算环境的另一实施例的示意性框图。
图3B是图解说明根据一个实施例并行编码细流的一个实施例的示意性框图。
图4是根据编解码器强制的帧大小编码媒体内容的音频以在具有所述媒体内容的固定时间视频部分的内容文件之间分割全音频帧的方法的一个实施例的流程图。
图5A到5C是产生具有固定时间视频部分及具有编解码器强制的帧大小的全音频帧的内容文件的一个实施例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾科星先进科技公司,未经艾科星先进科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080061488.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能老年人助行车
- 下一篇:一种制备表面带有蝌蚪状结晶结构的碳薄膜的方法