[发明专利]一种全息语音通信方法、装置、终端及计算机可读存储介质在审
申请号: | 202010144625.0 | 申请日: | 2020-03-04 |
公开(公告)号: | CN113365202A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 郭法永 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;H04R5/027;G10L19/008 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 薛祥辉 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全息 语音 通信 方法 装置 终端 计算机 可读 存储 介质 | ||
1.一种全息语音通信方法,应用于发送端,包括:
采集空间声场中不同位置至少一个音频信号,将所述音频信号组成信号向量,并生成全息声场数据;
对所述全息声场数据进行仿耳廓效果处理,生成第一全息语音数据;
将所述第一全息语音数据进行预定义场景模型处理,并更新所述第一全息语音数据;
将更新后的第一全息语音数据传输至接收端,用于所述接收端进行预定义场景转换处理从而生成第二全息语音数据。
2.如权利要求1所述的全息语音通信方法,其特征在于,所述生成全息声场数据包括:
对所述音频信号进行转换与编码,添加所述音频信号源端信息,生成原始音频数据;
根据所述原始音频数据构建并输出全息声场数据。
3.如权利要求1所述的全息语音通信方法,其特征在于,所述对所述全息声场音频数据进行仿耳廓效果处理,生成第一全息语音数据包括:
在所述全息声场数据的基础上进行突出主要声源处理,并判断所述主要声源在空间声场中相对于第一基准位置的相对位置,所述第一基准位置为进行音频信号采集的发送端的位置;
将所述突出主要声源处理的全息声场数据进行更新生成第一全息语音数据。
4.如权利要求3所述的全息语音通信方法,其特征在于,所述将所述第一全息语音数据进行预定义场景模型处理包括:
根据所述预定义场景模型修复所述主要声源之外的其他数据部分;
根据所述主要声源的相对位置来确定所述主要声源在所述预定义场景模型中的绝对位置。
5.一种全息语音通信方法,应用于接收端,包括:
将接收到的第一全息语音数据进行预定义场景转换处理生成第二全息语音数据,其中,所述第一全息语音数据为对所述发送端采集空间声场中不同位置至少一个音频信号生成的全息声场数据进行仿耳廓效果处理以及预定义场景模型处理后生成;
以所述第二全息语音数据为基准,生成空间声场中不同发音位置对应的专属全息语音数据;
对所述专属全息语音数据进行适配调整,更新所述专属全息语音数据并进行分发;
对更新后的专属全息语音数据进行解析和执行处理。
6.如权利要求5所述的全息语音通信方法,其特征在于,所述生成空间声场中不同发音位置对应的专属全息语音数据之前包括:
将所述发音位置在预定义场景模型中的位置进行上报。
7.如权利要求5所述的全息语音通信方法,其特征在于,所述将接收到的第一全息语音数据进行预定义场景转换处理生成第二全息语音数据包括:
根据所述第一全息语音数据的位置信息以及在预定义场景转换模型中对应的第二基准位置,将所述第一全息语音数据转换生成对应于所述第二基准位置的第二全息语音数据,其中,所述第二基准位置为接收端所在的位置。
8.如权利要求7所述的全息语音通信方法,其特征在于,所述生成空间声场中不同发音位置对应的专属全息语音数据包括:
根据所述第二基准位置以及发音位置在预定义场景模型中的位置,生成所述专属全息语音数据。
9.一种全息语音通信装置,包括:全息声场采集单元、仿耳廓处理单元、预定义场景模型处理单元以及通信处理单元;
所述全息声场采集单元,用于采集空间声场中不同位置至少一个音频信号,将所述音频信号组成信号向量,并生成全息声场数据;
所述仿耳廓处理单元,用于对所述全息声场数据进行仿耳廓效果处理,生成第一全息语音数据;
所述预定义场景模型处理单元,用于将所述第一全息语音数据进行预定义场景模型处理,并更新所述第一全息语音数据;
所述通信处理单元,用于将更新后的第一全息语音数据传输至接收端,作为所述接收端进行预定义场景转换处理生成第二全息语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010144625.0/1.html,转载请声明来源钻瓜专利网。