[发明专利]基于生成对抗网络的语音处理方法、装置、设备及介质在审
申请号: | 202011387380.0 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112397057A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 郑振鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L21/02;G10L25/30;G10L25/87 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 语音 处理 方法 装置 设备 介质 | ||
本申请涉及语音处理技术领域,揭露一种基于生成对抗网络的语音处理方法、装置、设备及介质,其中方法包括获取待处理语音段,按照预设长度对待处理语音段进行切割,并对切割次序进行标记,得到切割语音段和切割次序标记;将切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和降噪的语音信号对应的语音端点信息;将降噪的语音信号与对应的语音端点信息进行结合,形成待拼接的语音信号;将待拼接的语音信号按照切割次序标记进行拼接,得到重塑语音信号。本申请还涉及区块链技术,待处理语音段存储于区块链中。本申请通过将降噪的语音信号和语音端点信息进行结合,有效提高了语音处理的准确度。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种基于生成对抗网络的语音处理方法、装置、设备及介质。
背景技术
语音处理包括语音增强(Speech Enhancement)和语音端点检测(Voice ActivityDetection)等步骤。语音增强旨在去除掉混在语音信号的背景噪声,通过去除掉背景噪声,可以获取更加清晰的语音信号,利于后续的任务获取较好的表现效果。语音端点检测旨在获取语音端的起始端点,通过消除掉非语音,可以减少后续的计算,提高后续语音系统的鲁棒性和准确性。但实际环境的背景噪声过大给语音处理都带来了巨大挑战。
为了解决实际环境中背景噪声过大的问题,现有方法是通过将带有背景噪音的待处理语音输入到生成对抗网络中,再通过生成对抗网络中判别器对待处理语音进行判别,然后通过对判别结果进行训练,以达到去除背景噪声的目的。但是,这种方法在语音处理中,由于是直接将待处理语音进行直接对判别,容易导致判别结果误差相差较大,从而导致最终语音处理噪声的效果不够明显,使得语音处理准确度较低。现亟需一种能够提高语音处理准确度的方法。
发明内容
本申请实施例的目的在于提出一种基于生成对抗网络的语音处理方法、装置、设备及介质,以提高语音处理的准确度。
为了解决上述技术问题,本申请实施例提供一种基于生成对抗网络的语音处理方法,包括:
获取待处理语音段,按照预设长度对所述待处理语音段进行切割,并对切割次序进行标记,得到切割语音段和切割次序标记;
将所述切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和所述降噪的语音信号对应的语音端点信息;
将所述降噪的语音信号与所述对应的语音端点信息进行结合,形成待拼接的语音信号;
将待拼接的语音信号按照所述切割次序标记进行拼接,得到重塑语音信号。
为了解决上述技术问题,本申请实施例提供一种基于生成对抗网络的语音处理装置,包括:
待处理语音段获取模块,用于获取待处理语音段,按照预设长度对所述待处理语音段进行切割,并对切割次序进行标记,得到切割语音段和切割次序标记;
切割语音段输入模块,用于将所述切割语音段输入到训练好的生成对抗网络中,得到降噪的语音信号和所述降噪的语音信号对应的语音端点信息;
待拼接的语音信号模块,用于将所述降噪的语音信号与所述对应的语音端点信息进行结合,形成待拼接的语音信号;
重塑语音信号获取模块,用于将待拼接的语音信号按照所述切割次序标记进行拼接,得到重塑语音信号。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于生成对抗网络的语音处理方法。
为解决上述技术问题,本发明采用的一个技术方案是:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于生成对抗网络的语音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011387380.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种偏心曲柄连杆结构
- 下一篇:一种智能预控系统用信息显示装置及其使用方法