[发明专利]用于音频编码的量化有效

申请号：	201080010331.3	申请日：	2010-02-02
公开（公告）号：	CN102341846A	公开（公告）日：	2012-02-01
发明（设计）人：	潘在美	申请（专利权）人：	韩国科亚电子股份有限公司
主分类号：	G10L19/00	分类号：	G10L19/00
代理公司：	北京派特恩知识产权代理事务所(普通合伙) 11270	代理人：	张颖玲;孟桂超
地址：	韩国***	国省代码：	韩国;KR
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于音频编码量化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种音频编码技术。

背景技术

一般来讲，MPEG(Moving Picture Experts Group，动态图像专家组)音频编码是用于进行高质量以及高效率编码的国际标准化组织/国际电工委员会(ISO/IEC)的标准方式。MPEG音频编码方法是在ISO/IEC SC29/WG11设置的MPEG内与视频(Moving Picture)编码一同被标准化的。MPEG音频编码是着重于实现高压缩率(High Compression Rate)的同时最大限度地降低主观性音质损失的编码标准。

MPEG音频编码采用各种方式防止收听者感知到编码过程中所产生的量化噪声。例如，MPEG音频编码算法使用心理声学模型(Psychoacoustic Model)，以反映人们的知觉(Perception)特性，消除知觉重复性，由此在编码后维持良好的音质。使用心理声学模型的音频编码器利用听到音频信号的人们的听觉特性，在编码时省略人们难以感知的细节信息，由此通过减少编码量来实现高效率的压缩。

使用心理声学模型的音频编码器，利用了人们能够听到的声音的最小级别的最小可听界限(Threshold in Quite)以及特定临界值以下的微弱的声音被某种声音掩蔽的掩蔽(Masking)效应。例如，使用心理声学模型的音频编码器既能够在编码过程中去除人们难以听到的非常低或非常高的频率成分，还能够以低于原来的精密度对被某种频率成分掩蔽的频率成分进行编码。

使用心理声学模型的音频编码器使用基于这种心理声学模型计算的值，对数据进行量化以及编码。例如，MPEG音频编码器在将时域的音频数据转换成频域的音频数据之后，利用心理声学模型模块求出各个不同频带的最大容许噪声的量，即最大容许失真(Allowed Distortion)，并据此进行量化以及编码。

发明内容

本发明要解决的技术课题是，提供一种能够预先设定要在进行音频数据的量化时使用的公用比例因子的初始值，使得该公用比例因子的初始值最大限度地接近公用比例因子的值，从而能够大幅减少进行量化时的循环反复次数的技术、系统以及装置。

为了解决这种技术课题，根据本发明的一方面(Aspect)提供一种音频编码器的量化方法。上述音频编码器的量化方法包括如下的步骤：分析从外部接收的音频数据第一帧的频谱数据，计算出上述音频数据第一帧的最大频谱绝对值的步骤；基于上述音频数据第一帧的最大频谱绝对值以及之前计算出的音频数据第二帧的最大频谱绝对值，设定要在进行上述音频数据第一帧的量化时使用的公用比例因子的初始值的步骤；以及基于所设定的上述公用比例因子的初始值，对上述音频数据第一帧的频谱数据进行量化的步骤。

计算出上述音频数据第一帧的最大频谱绝对值的步骤包括计算出在上述音频数据第一帧的频谱数据中绝对值最大的部分的绝对值的步骤。

设定要在进行上述音频数据第一帧的量化时使用的公用比例因子的初始值的步骤包括：使用特定的比较算法，将上述音频数据第一帧的最大频谱绝对值与上述音频数据第二帧的最大频谱绝对值进行比较的步骤；以及使用与上述比较的结果值对应的计算算法，计算出要在进行上述音频数据第一帧的量化时使用的公用比例因子的初始值的步骤。

将上述音频数据第一帧的最大频谱绝对值与上述音频数据第二帧的最大频谱绝对值进行比较的步骤包括：对上述音频数据第一帧的最大频谱绝对值取二进制对数，计算出第一二进制对数值的步骤；对上述音频数据第二帧的最大频谱绝对值取二进制对数，计算出第二二进制对数值的步骤；以及计算出上述第一二进制对数值和上述第二二进制对数值之间的差值的步骤。

设定要在进行上述音频数据第一帧的量化时使用的公用比例因子的初始值的步骤包括：决定与上述第一二进制对数值和上述第二二进制对数值之间的差值对应的计算算法的步骤；以及使用所决定的上述计算算法，计算出上述公用比例因子的初始值的步骤。决定上述计算算法的步骤包括将上述第一二进制对数值和上述第二二进制对数值之间的差值与至少一个常数值进行比较的步骤。

计算出上述公用比例因子的初始值的步骤包括使用上述音频数据第二帧的公用比例因子的值、从上述第一二进制对数值减去上述第二二进制对数值的值以及特定常数值中的至少一个值进行运算的步骤。

上述的音频数据的量化方法还包括在计算出的上述音频数据第一帧的最大频谱绝对值为0的情况下，将预先设定的常数值设定为上述音频数据第一帧的公用比例因子的初始值的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于韩国科亚电子股份有限公司，未经韩国科亚电子股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201080010331.3/2.html，转载请声明来源钻瓜专利网。

上一篇：包含封端的异氰酸酯树脂的粒子和使用该粒子改进井筒的方法
下一篇：能够减低参照泄漏的发生或相位噪声的PLL电路

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于音频编码的量化有效

专利文献下载