[发明专利]一种结合码率分层和质量分层的音频编码量化控制的方法有效
申请号: | 202011105481.4 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112420059B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 梅元刚;刘宇新;朱政 | 申请(专利权)人: | 杭州微帧信息科技有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 分层 质量 音频 编码 量化 控制 方法 | ||
本发明公开了一种结合码率分层和质量分层的音频编码量化控制的方法,属于音频编码领域。所述方法包括以下步骤:首先根据预测的质量控制因子acrf和初始的码率分层对音频进行预编码;然后根据编码结果调整码率,使BDrate(表征码率消耗和质量提升的对应关系)在该码率下达到最高,在区间内相对质量最好,并且得到质量控制因子和码率之间合理的线性映射方式,既能均衡质量又能对应质量调节码率。
技术领域
本发明涉及音频编码技术领域,尤其涉及一种结合码率分层和质量分层的音频编码量化控制的方法。
背景技术
音频编码的主要目的是在保证一定主观听觉质量的前提下,最大程度地去除输入信号的统计冗余和感知冗余来实现数据量的压缩,以满足不同传输和存储条件下的需求。
在以下场景中,人们对音频码率有分层控制的需求,希望在不同条件下适用不同的码率,并且尽量保持每一条件下的音频质量。
1)对音频内容进行瘦身及按质量分档进行存储,以节约存储空间并尽量保持音频质量。
2)在面对在线语音交互方面:
- 包括实时通讯、直播、移动端点播、大型音频服务系统在线语音转发等场景;
- 需要既节约流量又控制并发带宽和保持服务稳定,同时保持音频质量。
目前做法的局限性在于:
使用定码率(CBR)对音频进行编码时,码率得到了有效的控制,但是降低码率的同时,音频的质量和细节不能保证。对于不该降低质量的内容场景也采用限制码率,虽然有效的控制了码率,但是会导致,在不同的码率区间,码率控制不精准,存在一定的抖动;质量不稳定,波动较大;对某些声音场景(语音、音乐等都存在)质量损伤较大,主观效果较差。
使用可变码率(VBR)对音频进行编码时,能相对保持质量稳定,但存在码率整体偏大,且不能精准控制码率,缺乏在不同码率分层控制,具体表现为,可变码率区间比较窄;针对不同的内容,某些内容或某些码率区间,码率存在较大的波动,大码率对质量的贡献并不大;不能适应实际产品的码率分层并控制质量稳定的需求。
定码率(CBR)和可变码率(VBR)在音频编码时,面对不同的任务,都无法做到线性的控制码率,并保证质量的稳定。
发明内容
针对上述缺点本发明提供了一种结合码率分层和质量分层的音频编码量化控制的方法。本发明的核心思想在于结合码率和质量量化控制因子(ACRF),找到一种合理的线性映射方式,设置合理的码率控制区间及质量控制区间的边界点,实现在均衡质量的同时又可以根据质量需求调节码率。
本发明提供的一种结合码率分层和质量分层的音频编码量化控制的方法,包括以下步骤:
(1)根据输入音频的采样率建立初始的码率分档码表,所述分档码表包括采样率,单声道码率和双声道码率。
(2)根据输入音频的帧长度、采样率和每一通道的码率要求,确定输入的音频采用哪一档的码率。
(3)确定目标质量分层和对应的码率分层。
(4)根据不同的质量控制因子ACRF和初始的码率分档码表,找到对应受控码率区间边界,确定质量分层和码率分层的分界点。
(5)对步骤(4)确定的ACRF和码率进行预编码,得到预编码的码率范围,即该质量对应的实际的码率范围。
(6)根据得到的每一档最优的质量量化因子acrfbest,以及最小的质量量化因子min_f和最大的质量量化因子max_f,按线性映射计算最终的编码质量量化因子:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微帧信息科技有限公司,未经杭州微帧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011105481.4/2.html,转载请声明来源钻瓜专利网。