[发明专利]基于生成对抗网络的语音处理方法、装置、设备及介质在审
申请号: | 202011387380.0 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112397057A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 郑振鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L21/02;G10L25/30;G10L25/87 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 语音 处理 方法 装置 设备 介质 | ||
1.一种基于生成对抗网络的语音处理方法,其特征在于,包括:
获取待处理语音段,按照预设长度对所述待处理语音段进行切割,并对切割次序进行标记,得到切割语音段和切割次序标记;
将所述切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和所述降噪的语音信号对应的语音端点信息;
将所述降噪的语音信号与所述对应的语音端点信息进行结合,形成待拼接的语音信号;
将待拼接的语音信号按照所述切割次序标记进行拼接,得到重塑语音信号。
2.根据权利要求1所述的基于生成对抗网络的语音处理方法,其特征在于,在所述将所述切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和所述降噪的语音信号对应的语音端点信息之前,所述方法还包括:
获取预设的噪音语音信号和目标语音信号,并按照所述预设长度对所述噪音语音信号和所述目标语音信号进行切割,得到噪音语音段和目标语音段;
按照随机抽取不放回的方式,抽取噪音语音段和目标语音段,作为训练数据;
将所述训练数据输入生成对抗网络中,生成观测语音段和判别结果,并根据所述观测语音段与所述判别结果,计算损失函数值,得到目标损失;
根据所述目标损失更新生成对抗网络的参数,得到所述训练好的生成对抗网络。
3.根据权利要求2所述的基于生成对抗网络的语音处理方法,其特征在于,所述将所述训练数据输入生成对抗网络中,生成观测语音段和判别结果,并根据所述观测语音段与所述判别结果,计算损失函数值,得到目标损失,包括:
将所述训练数据中的噪音语音段输入到生成对抗网络的生成器中,生成所述观测语音段,并计算所述观测语音段和所述训练数据中的目标语音段的损失函数值,得到第一损失值;
将所述训练数据中的噪音语音段输入到生成对抗网络的判别器中,得到第一判别结果,并计算所述第一判别结果的损失函数值,得到第二损失值;
将所述训练数据中的目标语音段输入到生成对抗网络的判别器中,得到第二判别结果,并计算所述第二判别结果的损失函数值,得到第三损失值;
将所述第一损失值、所述第二损失值以及所述第三损失值作为所述目标损失。
4.根据权利要求3所述的基于生成对抗网络的语音处理方法,其特征在于,所述根据所述目标损失更新生成对抗网络的参数,得到所述训练好的生成对抗网络,包括:
根据所述第一损失值,更新所述生成对抗网络的生成器参数;
根据所述第二损失值和所述第三损失值,更新所述生成对抗网络的判别器参数;
当所述第一损失值达到预设阈值时,停止更新所述生成对抗网络的参数,得到所述训练好的生成对抗网络。
5.根据权利要求1所述的基于生成对抗网络的语音处理方法,其特征在于,所述将所述切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和所述降噪的语音信号对应的语音端点信息,包括:
将所述切割语音段输入到训练好的生成对抗网络中,通过生成器的编码-解码模型对所述切割语音段生成序列矩阵特征;
按照跳跃连接的方式,将同等大小的所述序列矩阵特征进行结合,得到目标特征;
将所述目标特征输入到所述生成器的全连接层网络中,得到所述降噪的语音信号;
将所述降噪的语音信号输入到所述训练好的生成对抗网络的判别器中,得到所述降噪的语音信号对应的语音端点信息。
6.根据权利要求5所述的基于生成对抗网络的语音处理方法,其特征在于,所述按照跳跃连接的方式,将同等大小的所述序列矩阵特征进行结合,得到目标特征,包括:
遍历所述序列矩阵特征,获取同等大小的所述序列矩阵特征,作为目标矩阵,其中,所述目标矩阵的宽度和高度一致;
通过跳跃连接的方式,将所述目标矩阵进行结合,得到所述目标特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011387380.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种偏心曲柄连杆结构
- 下一篇:一种智能预控系统用信息显示装置及其使用方法