[发明专利]语音处理方法及装置、计算机存储介质、电子设备在审
申请号: | 202011128423.3 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112259114A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 丁涵宇;林悦;陈堆盛 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/12;G10L25/18;G10L25/24;G10L25/30;G10L25/45;G10L17/02;G10L17/04;G10L19/16 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 计算机 存储 介质 电子设备 | ||
1.一种语音处理方法,其特征在于,包括:
获取语音序列,对所述语音序列进行分帧处理得到多个语音子序列,提取各所述语音子序列的目标特征;
根据各所述目标特征通过语音检测模型对各所述语音子序列进行检测,并根据检测结果确定有效语音;
将所述有效语音对应的目标特征输入声纹识别模型,通过所述声纹识别模型从所述有效语音中筛选出目标语音;
控制将所述目标语音转发至其它客户端。
2.根据权利要求1所述的语音处理方法,其特征在于,所述根据各所述目标特征通过语音检测模型对各所述语音子序列进行检测,包括:
将各所述目标特征输入所述语音检测模型中进行特征提取,以得到各所述目标特征对应的语音子序列的目标概率;
在所述语音子序列的目标概率大于第一概率阈值时,则判定所述语音子序列为有效语音子序列。
3.根据权利要求1所述的语音处理方法,其特征在于,所述方法还包括:
获取所述语音序列中的初始噪声子序列,并根据所述初始噪声子序列计算所述语音序列对应的噪声能量;
计算各所述语音子序列的语音能量,并根据所述噪声能量和所述语音能量确定所述语音子序列对应的信噪比;
若所述语音子序列对应的信噪比大于信噪比阈值,则判定所述语音子序列为有效语音子序列。
4.根据权利要求3所述的语音处理方法,其特征在于,所述获取所述语音序列中的初始噪声子序列,并根据所述初始噪声子序列计算所述语音序列对应的噪声能量,包括:
将所述语音序列的前预设个数的语音子序列作为所述初始噪声子序列,计算所述初始噪声子序列的语音能量,将所述初始噪声子序列的语音能量作为初始噪声能量;
获取所述语音序列对应的时间序列,根据所述时间序列、所述初始噪声能量和所述语音序列对应的语音能量对所述噪声能量进行迭代更新。
5.根据权利要求1所述的语音处理方法,其特征在于,所述方法还包括:
获取各所述语音子序列的目标概率和各所述语音子序列的信噪比;
在所述语音子序列的目标概率大于第一概率阈值时,判断所述语音子序列对应的信噪比是否大于信噪比阈值;
若所述语音子序列对应的信噪比大于所述信噪比阈值,则判定所述语音子序列为所述有效语音子序列。
6.根据权利要求2、3或5任一项所述的语音处理方法,其特征在于,所述根据检测结果确定有效语音,包括:
对所述语音序列进行滑窗操作,以获取多个连续语音序列,其中,所述滑窗操作的窗长大于窗偏移量;
获取各所述连续语音序列中有效语音子序列的个数,若所述有效语音子序列的个数大于个数阈值,则判定所述连续语音序列为所述有效语音。
7.根据权利要求1所述的语音处理方法,其特征在于,所述将所述有效语音对应的目标特征输入声纹识别模型,通过所述声纹识别模型从所述有效语音中筛选出目标语音,包括:
将所述有效语音对应的目标特征作为有效目标特征,将所述有效目标特征输入所述声纹识别模型中进行特征提取,以得到所述有效目标特征对应的有效语音子序列的语音表征向量;
获取目标表征向量,根据所述语音表征向量和所述目标表征向量计算所述有效语音子序列对应的PLDA评分;
若所述PLDA评分大于评分阈值,则所述有效语音子序列为目标语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011128423.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自助取药系统
- 下一篇:一种高缓冲安全型新能源车用车架构