[发明专利]丢包补偿方法及装置有效
申请号: | 202010485134.2 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111653285B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王晓红;陈佳路;刘鲁鹏;元海明;高强;夏龙;郭常圳 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L25/30;G06N3/08;G06N3/0464 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 补偿 方法 装置 | ||
1.一种丢包补偿方法,包括:
获取目标音频信号的丢包信号区段,其中所述丢包信号区段包括丢包位置,以及丢包位置的上下文预定时长的音频信号区段;
将所述丢包信号区段从时域变换到频域,得到第一频域参数;
将所述第一频域参数输入预先建立的基于深度神经网络的音频补偿模型,获得第二频域参数,其中,所述第二频域参数是与所述丢包位置相关的频域参数,所述音频补偿模型包括:第一卷积层组、全连接层组、第二卷积层组和通讯层,所述通讯层位于所述第一卷积层组和所述第二卷积层组中,用于幅值参数和相位参数交互;将所述多个频域帧中的每个频域帧的第一幅值参数输入第一卷积层组,得到中间参数;将所述中间参数输入全连接层组,得到幅值实数;计算参考幅值与所述幅值实数的乘积,作为与所述丢包位置相关的频域帧的第二幅值参数;将所述多个频域帧中的每个频域帧的第一相位参数输入第二卷积层组,得到与所述丢包位置相关的频域帧的第二相位参数;
根据所述第二频域参数与所述第一频域参数得到第三频域参数;
其中,根据所述第二频域参数与所述第一频域参数得到第三频域参数,包括:
将所述第二频域参数与所述第一频域参数中的与丢包位置不相关的频域帧的频域参数进行拼接,得到第三频域参数。
2.如权利要求1所述的丢包补偿方法,还包括:
对所述第三频域参数进行从频域到时域的变换,得到经过丢包补偿的目标音频信号。
3.如权利要求1或2所述的丢包补偿方法,其中,将所述丢包信号区段从时域变换到频域,得到第一频域参数,包括:
将所述丢包位置用零填充;
将所述丢包信号区段进行短时傅里叶变换,生成所述第一频域参数。
4.如权利要求3所述的丢包补偿方法,其中,所述丢包位置的上下文预定时长的音频信号区段包括:位于丢包位置之前的第一数量个时域帧的第一音频信号区段和/或位于丢包位置之后的第二数量个时域帧的第二音频信号区段;
将所述丢包信号区段进行短时傅里叶变换,生成所述第一频域参数,包括:
基于预定帧长和帧步长,对所述第一音频信号区段和/或所述第二音频信号区段以及所述丢包位置进行短时傅里叶变换,获得符合所述帧步长的多个频域帧;
获得所述多个频域帧的频域参数作为所述第一频域参数。
5.如权利要求4所述的丢包补偿方法,其中,基于预定帧长和帧步长,对所述第一音频信号区段和/或所述第二音频信号区段以及所述丢包位置进行短时傅里叶变换,获得符合所述帧步长的多个频域帧,包括:利用窗长度为所述预定帧长、步长为所述帧步长的汉宁窗,对所述第一音频信号区段和/或所述第二音频信号区段以及所述丢包位置进行短时傅里叶变换,获得符合所述帧步长的多个频域帧。
6.如权利要求1所述的丢包补偿方法,其中,所述丢包补偿方法还包括:
对所述第三频域参数进行从频域到时域的变换,得到经过丢包补偿的目标音频信号;
将所述经过丢包补偿的目标音频信号中的前m个时域帧的音频信号替换为原始的目标音频信号中的前m个时域帧的音频信号,将所述经过丢包补偿的目标音频信号中的后n个时域帧的音频信号替换为所述原始的目标音频信号中的后n个时域帧的音频信号,其中,m和n均为大于等于1的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010485134.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能货柜及其使用方法
- 下一篇:一种化学交联型聚酰亚胺气凝胶及其制备方法