[发明专利]三维音频信号编码方法、装置和编码器在审
申请号: | 202110536631.5 | 申请日: | 2021-05-17 |
公开(公告)号: | CN115376529A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 高原;刘帅;王宾;王喆;曲天书;徐佳浩 | 申请(专利权)人: | 华为技术有限公司;北京大学 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 吴瑜 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 音频 信号 编码 方法 装置 编码器 | ||
1.一种三维音频信号编码方法,其特征在于,包括:
根据三维音频信号的当前帧、候选虚拟扬声器集合和投票轮数确定第一数量个虚拟扬声器和第一数量个投票值,所述虚拟扬声器与所述投票值一一对应,所述第一数量个虚拟扬声器包括第一虚拟扬声器,所述第一虚拟扬声器的投票值用于表征所述第一虚拟扬声器的优先级,所述候选虚拟扬声器集合包括第五数量个虚拟扬声器,所述第五数量个虚拟扬声器包括所述第一数量个虚拟扬声器,所述第一数量小于或等于所述第五数量,所述投票轮数为大于或等于1的整数,且所述投票轮数小于或等于所述第五数量;
根据所述第一数量个投票值,从所述第一数量个虚拟扬声器中选取第二数量个当前帧代表虚拟扬声器,所述第二数量小于所述第一数量;
根据所述第二数量个当前帧的代表虚拟扬声器对所述当前帧进行编码,得到码流。
2.根据权利要求1所述的方法,其特征在于,所述投票轮数是根据所述三维音频信号的当前帧中指向性声源的数量、对所述当前帧进行编码的编码速率和对所述当前帧进行编码的编码复杂度中至少一个确定的。
3.根据权利要求1或2所述的方法,其特征在于,所述第二数量是预设的,或者,所述第二数量是根据所述当前帧确定的。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述第一数量个投票值,从所述第一数量个虚拟扬声器中选取第二数量个当前帧的代表虚拟扬声器包括:
根据所述第一数量个投票值和预设阈值,从所述第一数量个虚拟扬声器中选取所述第二数量个当前帧的代表虚拟扬声器。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述第一数量个投票值,从所述第一数量个虚拟扬声器中选取第二数量个当前帧的代表虚拟扬声器包括:
按照所述第一数量个投票值,从所述第一数量个投票值中确定第二数量个投票值,所述第一数量个虚拟扬声器中与所述第二数量个投票值对应的第二数量个虚拟扬声器为所述第二数量个当前帧的代表虚拟扬声器。
6.根据权利要求1-5中任一项所述的方法,其特征在于,当所述第一数量与所述第五数量相等时,所述根据三维音频信号的当前帧、候选虚拟扬声器集合和投票轮数确定第一数量个虚拟扬声器和第一数量个投票值包括:
获取所述当前帧的第三数量个代表系数,所述第三数量个代表系数包括第一代表系数和第二代表系数;
获取所述第五数量个虚拟扬声器分别与所述第一代表系数在所述投票轮数个投票轮后的第五数量个第一投票值,所述第五数量个第一投票值包括所述第一虚拟扬声器的第一投票值;
获取所述第五数量个虚拟扬声器分别与所述第二代表系数在所述投票轮数个投票轮后的第五数量个第二投票值,所述第五数量个第二投票值包括所述第一虚拟扬声器的第二投票值;
基于所述第五数量个第一投票值和所述第五数量个第二投票值获得所述第五数量个虚拟扬声器各自的投票值,其中,所述第一虚拟扬声器的投票值基于所述第一虚拟扬声器的第一投票值和所述第一虚拟扬声器的第二投票值获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学,未经华为技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110536631.5/1.html,转载请声明来源钻瓜专利网。