[发明专利]一种语音通话的处理方法以及相关装置有效

申请号：	202010014701.6	申请日：	2020-01-07
公开（公告）号：	CN111179957B	公开（公告）日：	2023-05-12
发明（设计）人：	吴伟;余涛;方雪飞	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0232;G10L25/03;G10L25/30
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音通话处理方法以及相关装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音通话的处理方法，其特征在于，包括：

采集通话时间段内的语音信息；

将所述语音信息输入神经网络模型，以获取第一掩模值，所述神经网络模型基于多个参考信号与多个采集信号进行特征训练所得，所述参考信号用于指示通话过程中的干扰因素，所述采集信号用于指示通话过程中的有效语音，所述第一掩模值用于指示所述语音信息是所述有效语音的概率；

根据所述第一掩模值确定所述语音信息的信干比；

根据所述信干比对所述语音信息进行处理，以得到用于输出的语音。

2.根据权利要求1所述的方法，其特征在于，所述语音信息包括至少两个帧，针对所述至少两个帧中的第一帧，所述方法还包括：

获取所述第一帧的延时信息；

确定与所述第一帧的延时信息对应第一计算公式；

所述根据所述第一掩模值确定所述语音信息的信干比，包括：

将所述第一掩模值代入到所述第一计算公式，以确定所述第一帧的幅度谱；

根据所述至少两个帧中每个第一帧的幅度谱确定所述语音信息的信干比。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取当前时刻的参考信号与当前时刻的采集信号，并确定相关度；

所述将所述第一掩模值代入到所述第一计算公式，以确定所述第一帧的幅度谱，包括：

根据所述第一帧的延时信息确定延时状态，所述延时状态包括延时稳定和延时波动；

根据所述相关度确定不同延时状态下所述第一帧对应的所述第一计算公式。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一帧的延时信息确定延时状态，包括：

若所述第一帧与相邻帧的延时差值小于延时阈值，则确定多个帧的延时状态为延时稳定；

若所述第一帧与所述相邻帧的延时差值大于或等于所述延时阈值，则确定所述多个帧的延时状态为延时波动。

5.根据权利要求4所述的方法，其特征在于，所述若所述第一帧与所述相邻帧的延时差值大于或等于所述延时阈值，则确定所述多个帧的延时状态为延时波动，包括：

确定第二帧的延时信息；

若所述第二帧的延时信息大于或等于所述延时阈值，则确定预设范围内多个帧的延时信息，所述预设范围包括所述第一帧和所述第二帧。

6.根据权利要求5所述的方法，其特征在于，所述采集通话时间段内的语音信息之后，所述方法还包括：

将所述语音信息进行傅里叶变换，以使得所述语音信息由时域变换到频域；

对变换后的所述语音信息进行线性滤波处理，以得到线性输出。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

确定第三帧线性滤波处理过程中的滤波器系数，所述第三帧在所述第一帧和所述第二帧之前；

根据所述滤波器系数确定滤波估计差值；

根据所述滤波估计差值对所述滤波器系数进行更新，以得到第四帧的模拟回声，所述第四帧为所述第三帧的下一帧。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

基于所述相关度对所述模拟回声进行处理，以得到第二掩模值；

所述根据所述第一掩模值确定所述语音信息的信干比，包括：

根据所述第一掩模值和所述第二掩模值获取所述语音信息的信干比。

9.根据权利要求8所述的方法，其特征在于，所述对所述语音信息进行非线性处理，以得到第二掩模值，包括：

确定所述语音信息中的多个频点；

将所述模拟回声与所述多个频点进行对应，以得到每个频点中所述模拟回声的分布比例；

根据所述分布比例确定所述第二掩模值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010014701.6/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音通话的处理方法以及相关装置有效

专利文献下载