[发明专利]高阶Ambisonic音频编解码方法及装置有效
申请号: | 201910898634.6 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110544484B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 马士超 | 申请(专利权)人: | 中科超影(北京)传媒科技有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/13;G06N3/08;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 谷敬丽;许曼 |
地址: | 102300 北京市门头*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种高阶Ambisonic音频编解码方法及装置,编码包括:基于主成分分析法确定高阶Ambisonic音频的主成分矩阵,基于已训练的长短时记忆网络LSTM预测器对高阶Ambisonic音频进行预测,根据高阶Ambisonic音频、主成分矩阵和预测结果确定音频残差后对高阶Ambisonic音频进行编码;解码包括:将主成分矩阵投影至高维空间获得高维空间矩阵,基于LSTM预测器对主成分矩阵进行预测,根据高维空间矩阵、预测结果和音频残差获得解码后的高阶Ambisonic音频。该方案能减少存储高阶Ambisonic音频所需的参数,扩展其使用范围,使其适用于流媒体播放等实时性要求较高的场合。 | ||
搜索关键词: | ambisonic 音频 解码 方法 装置 | ||
【主权项】:
1.一种高阶Ambisonic音频编码方法,其特征在于,包括:/n基于主成分分析法PCA确定高阶Ambisonic音频的主成分矩阵;/n根据高阶Ambisonic音频和高阶Ambisonic音频的主成分矩阵,训练长短期记忆网络LSTM预测器,获得LSTM预测器参数;/n基于已训练的LSTM预测器,对高阶Ambisonic音频进行预测,获得预测结果;/n根据高阶Ambisonic音频、主成分矩阵和预测结果,确定音频残差;/n按照主成分矩阵、LSTM预测器参数和音频残差对所述高阶Ambisonic音频进行编码,获得已编码的高阶Ambisonic音频。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科超影(北京)传媒科技有限公司,未经中科超影(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910898634.6/,转载请声明来源钻瓜专利网。