[发明专利]丢包隐藏的方法、装置、存储介质和计算机设备有效
申请号: | 202010082432.7 | 申请日: | 2020-02-07 |
公开(公告)号: | CN111292768B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/21;G10L25/30;G10L25/45 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐藏 方法 装置 存储 介质 计算机 设备 | ||
本申请涉及一种丢包隐藏的方法、装置、存储介质和计算机设备,方法包括:接收语音数据包;当根据语音数据包确定出现丢包时,确定语音数据包中语音数据的语音功率谱;通过神经网络模型对语音功率谱进行丢包帧预测,得到丢包帧功率谱;根据语音功率谱和预测的丢包帧功率谱确定恢复后的语音数据。本申请提供的方案可以有效提高语音通话质量。
技术领域
本申请涉及网络通信技术领域,特别是涉及一种丢包隐藏的方法、装置、存储介质和计算机设备。
背景技术
语音在传输过程不可避免地出现丢包的情况,而丢包是影响语音通话质量的主要原因之一。丢包隐藏技术是指通过合成的语音数据包来补偿丢失的包,从而降低传输过程中的丢包对语音质量的影响。
传统的丢包隐藏方案中,当出现丢包时,通过对所丢包的前一帧信号进行估计得到基音周期,复制该前一帧的最后一个基音周期波形信号到所丢包的帧位置。上述方案中均假设丢包的位置与该丢包的前一帧信号极其相近,但实际上相邻语音信号很大概率上是存在差异的,而且细微的差异都是能被人耳感知的,因此会出现语音通话质量差的问题。
发明内容
基于此,有必要针对语音通话质量差的技术问题,提供一种丢包隐藏的方法、装置、存储介质和计算机设备。
一种丢包隐藏的方法,包括:
接收语音数据包;
当根据所述语音数据包确定出现丢包时,确定所述语音数据包中语音数据的语音功率谱;
通过神经网络模型对所述语音功率谱进行丢包帧预测,得到丢包帧功率谱;
根据所述语音功率谱和预测的丢包帧功率谱确定恢复后的语音数据。
一种丢包隐藏的装置,所述装置包括:
接收模块,用于接收语音数据包;
变换模块,用于当根据所述语音数据包确定出现丢包时,确定所述语音数据包中语音数据的语音功率谱;
预测模块,用于通过神经网络模型对所述语音功率谱进行丢包帧预测,得到丢包帧功率谱;
逆变换模块,用于根据所述语音功率谱和预测的丢包帧功率谱确定恢复后的语音数据。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述丢包隐藏的方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述丢包隐藏的方法的步骤。
上述丢包隐藏的方法、装置、存储介质和计算机设备,通过接收的语音数据包中的语音数据来确定语音功率谱,通过该神经网络模型对语音功率谱进行丢包帧预测得到丢包帧功率谱,从而可以得到所丢失的语音数据所对应的丢包帧功率谱,利用语音功率谱和预测的丢包帧功率谱得到恢复后的语音数据,从而避免直接将前一帧的最后一个基音周期波形信号到所丢包的帧位置,进而避免相邻语音信号之间存在差异而导致语音质量差的问题,从而有效地提高了语音通话的质量。
附图说明
图1为一个实施例中丢包隐藏的方法的应用环境图;
图2为一个实施例中丢包隐藏的方法的流程示意图;
图3为一个实施例中利用丢包数量和网络状态信息选择对应的神经网络模型,根据所选择的神经网络模型进行丢包帧功率谱预测步骤的流程示意图;
图4为一个实施例中神经网络模型训练的流程示意图;
图5为另一个实施例中神经网络模型训练的流程示意图;
图6为另一个实施例中丢包隐藏的方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010082432.7/2.html,转载请声明来源钻瓜专利网。