[发明专利]基于理想软阈值掩模IRM的多音频对象编、解码方法有效

申请号：	201610861273.4	申请日：	2016-09-28
公开（公告）号：	CN106373583B	公开（公告）日：	2019-05-21
发明（设计）人：	曲天书;吴玺宏;张爽;黄庆博	申请（专利权）人：	北京大学
主分类号：	G10L19/008	分类号：	G10L19/008
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	司立彬
地址：	100871 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于理想软阈值掩模IRM的多音频对象编、解码方法。本编码方法为：1)编码端对输入的各音频对象时间信息的元数据以及音频对象信息进行预处理模，形成通道形式的各音频对象；2)编码端将各通道形式的音频对象生成一个下混信号，然后根据该下混信号和第i个通道形式的音频对象进行软阈值掩模提取，生成第i个通道形式的音频对象的掩模MASKi；3)编码端针对所有音频对象的掩模MASK进行压缩，生成掩模码流；编码端将该下混信号经过编码压缩得到的编码结果、所述元数据和各所述掩模码流进行合成，得到合成码流输出。本发明充分利用了音频自身稀疏性的特点，压缩更有针对性并且更加有效。
搜索关键词：	基于理想阈值 irm 多音对象解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于理想软阈值掩模IRM的多音频对象编码方法，其步骤为：1)编码端对输入的各音频对象时间信息的元数据以及音频对象信息进行预处理模，形成通道形式的各音频对象；2)编码端将各通道形式的音频对象生成一个下混信号，然后根据该下混信号和第i个通道形式的音频对象进行软阈值掩模提取，生成第i个通道形式的音频对象的掩模MASK_i；其中，生成第i个通道形式的音频对象的掩模MASK_i的方法为：编码端对第i个通道形式的音频对象进行分帧、加窗、时频变换，得到频域信号S_target，编码端对所述下混信号分别进行分帧、加窗、时频变换，得到频域信号S_mix；然后对第i个通道形式的音频对象进行阈值计算，将频域能量小于阈值的点舍弃，即将其在掩模矩阵MASK_i中对应掩模值为零；对于频域能量大于阈值的点，使用第i个通道形式的音频对象的能量与所述下混信号的能量比值作为掩模值；然后对得到的掩模值进行合成，得到掩模MASK_i；3)编码端针对所有音频对象的掩模MASK进行压缩，生成掩模码流；4)编码端将该下混信号经过编码压缩得到的编码结果、所述元数据和各所述掩模码流进行合成，得到合成码流输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610861273.4/，转载请声明来源钻瓜专利网。

上一篇：一种高效叶片打孔取样器
下一篇：轻型高精度冰芯切割装置及其切割方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于理想软阈值掩模IRM的多音频对象编、解码方法有效

专利文献下载