[发明专利]一种基于人工智能的语音增强方法在审

专利信息
申请号: 202010551206.9 申请日: 2020-06-16
公开(公告)号: CN111833893A 公开(公告)日: 2020-10-27
发明(设计)人: 王亚东 申请(专利权)人: 杭州云嘉云计算有限公司
主分类号: G10L21/0208 分类号: G10L21/0208;G10L15/20
代理公司: 杭州杭诚专利事务所有限公司 33109 代理人: 尉伟敏
地址: 311100 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 语音 增强 方法
【说明书】:

本发明公开了一种基于人工智能的语音增强方法。为了克服现有技术数据处理复杂,模型臃肿,训练难度大,计算速度慢,灵活性差的问题;本发明包括以下步骤:S1:训练数据预处理;提取音频数据的时域序列,进行切片处理;S2:模型训练和部署;建立GAN算法模型,根据音频数据模拟进行对抗式训练;将训练完成的GAN算法模型部署到机器的服务器中;S3:模型测试;对测试数据中的带噪音频进行切片处理,在训练完成的GAN算法模型中进行数据除噪与音频重构,完成音频的语音增强;S4:模型评估优化;采用多种方式对语音增强后的音频质量进行评估。本方案基于GAN算法模型,模型结构简单,占用空间小,数据预处理简单,减小了训练难度,能够灵活调用。

技术领域

本发明涉及一种语音处理技术领域,尤其涉及一种基于人工智能的语音增强方法。

背景技术

在接收语音信号的同时,语音总是不可避免地受到噪声的干扰,或是遇到采音效果差等问题,这些干扰不仅造成语音污染,还会导致语音识别系统性能的恶化。一方面,受噪声污染的音频会恶化人的听感;另一方面,也一定程度上影响了语音识别系统的性能。因此,如何从含噪语音中提取尽可能纯净的原始语音,维持音频的声音强度,改善音频的可听性,是语音识别工作的一项重要内容。语音增强作为一种预处理方案,是改善智能语音服务和提高音频可听性的有效手段。

现有的语音增强的手段,例如,一种在中国专利文献上公开的“语音增强方法”,其公告号CN110767244A,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。

现有的语音增强的技术手段数据预处理复杂,需要做频域变换,分帧后还需再做拼接等处理;需先后训练多个模型,全连接结构参数量大,导致网络训练难度大,时间长;在面对一个新的噪声场景时,需要从新进行模型的训练;模型臃肿,计算速度慢。

发明内容

本发明主要解决现有技术数据处理复杂,模型臃肿,训练难度大,计算速度慢,灵活性差的问题;提供一种基于人工智能的语音增强方法,只需要一个GAN模型,就可以完成带噪音频的去噪工作,占用空间小,数据处理过程简单,训练难度减低。

本发明的上述技术问题主要是通过下述技术方案得以解决的:

本发明包括以下步骤:

S1:训练数据预处理;提取音频数据的时域序列,对音频数据进行切片处理;

S2:模型训练和部署;建立GAN算法模型,根据音频数据模拟进行对抗式训练;将训练完成的GAN算法模型部署到机器的服务器中;

S3:模型测试;对测试数据中的带噪音频进行切片处理,再训练完成的GAN算法模型中进行数据除噪与音频重构,完成音频的语音增强;

S4:模型评估优化;采用多种方式对语音增强后的音频质量进行评估。

本方案基于生成对抗网络(GAN)算法模型,模型结构简单,占用空间小,减小了训练难度,能够通过移动介质灵活转移和部署到服务端,满足用户的灵活调用。本方案采用端到端技术,直接对音频的时域序列进行处理,避免了复杂的数据预处理过程;用户只需要提供带噪音频,启动的服务即可自行进行音频切分并完成去噪,重构等过程,最终反馈给用户去除噪声的音频。

作为优选,GAN算法模型包括生成器G和判别器D;

生成器G模拟输入的真实音频数据分布的有效映射,生成与训练数据相关的新样本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010551206.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top