[发明专利]一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法无效
申请号: | 201010144567.8 | 申请日: | 2010-04-09 |
公开(公告)号: | CN101847413A | 公开(公告)日: | 2010-09-29 |
发明(设计)人: | 毛峡;邵伟国 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 新型 心理声学 模型 快速 比特 分配 实现 数字音频 编码 方法 | ||
1.一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法,其特征在于:该方法具体包括以下步骤:
(1)根据输入音频信号的方差来确定窗口的类型;
(2)根据确定的窗口类型及输入音频信号的能量来分配量化噪声,即最大允许失真,也称掩蔽阈值;
(3)使用上一帧音频信号全局比例因子的值作为本帧音频信号全局比例因子的初值;
(4)通过模型推导,获得各段比例因子的精确初值;
(5)通过改进折半查找的方法对全局比例因子进行调整;
(6)根据量化前后能量守恒原则对各段比例因子进行微调。
2.根据权利要求1所述的一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法,其特征在于:所述的步骤(1)根据输入音频信号的方差来确定窗口的类型,包括如下步骤:
(a)把输入的音频信号在时域上划分为8个等长的子块;
(b)计算每个子块的方差,求出最大值;
(c)通过子块方差的最大值或与前一帧子块方差的最大值的差值来确定窗口类型。
3.根据权利要求1所述的一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法,其特征在于:所述的步骤(2)中量化噪声的分配采用非线性函数根据子带能量的相对大小来计算允许的量化噪声,同时考虑压缩比越大,允许噪声越大;音质越高,允许噪声越小的要求,公式如下:
其中,Xmin代表最大允许失真,engr代表比例因子带内的平均能量,engravr代表全频带的平均能量,sfb是比例因子带序号,lastsb是最后一个含非零谱值的比例因子带的序号,start是比例因子带的起始谱线序号,last是最后一根非零谱线的序号,c是加权常数,在本发明中,对于短窗其值为0.858,对于长窗其值为1.4784。
4.根据权利要求1所述的一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法,其特征在于:所述的步骤(3)利用了音频信号的短时平稳特性,使用上一帧音频信号全局比例因子的值作为本帧音频信号全局比例因子的初值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010144567.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能磁性对接高安全无隙电源NS极接头
- 下一篇:一种可演奏三种音频声波的胡琴