[发明专利]语音增强方法、装置、存储介质及电子设备有效
申请号: | 202010773818.2 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111916095B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 殷翔 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/16;G10L13/04 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种语音增强方法、装置、存储介质和电子设备,所述方法包括:获取待处理的耳语数据;通过语音增强模型对所述耳语数据进行处理,以得到所述耳语数据对应的声学特征信息,其中,所述语音增强模型包括编码子模型和解码子模型,所述编码子模型用于对所述耳语进行编码,获得目标编码信息,所述解码子模型通过逐步单调注意力机制对所述目标编码信息进行解码,获得所述声学特征信息;根据所述声学特征信息进行语音合成,以得到与所述耳语数据对应的音频信息。由此,可以对耳语数据进行增强,从而可以增加该耳语数据的可懂度,便于用户之间交互和机器识别。并且,可以降低数据处理量,提高语音增强方法的处理效率,进一步提升用户使用体验。
技术领域
本公开涉及语音合成技术,具体地,涉及一种语音增强方法、装置、存储介质和电子设备。
背景技术
在禁止大声喧哗的场景下,用户正常语音对话通常会带来一些不方便,因此部分用户会选择采用耳语进行交互。而在该过程中获得的语音数据难以被机器准确识别。同时声带受损的用户发音和耳语音也比较接近,在交互过程中该发音数据的可懂度较低。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种语音增强方法,所述方法包括:
获取待处理的耳语数据;
通过语音增强模型对所述耳语数据进行处理,以得到所述耳语数据对应的声学特征信息,其中,所述语音增强模型包括编码子模型和解码子模型,所述编码子模型用于对所述耳语进行编码,获得目标编码信息,所述解码子模型通过逐步单调注意力机制对所述目标编码信息进行解码,获得所述声学特征信息;
根据所述声学特征信息进行语音合成,以得到与所述耳语数据对应的音频信息。
第二方面,本公开提供一种语音增强装置,所述装置包括:
第一获取模块,用于获取待处理的耳语数据;
处理模块,用于通过语音增强模型对所述耳语数据进行处理,以得到所述耳语数据对应的声学特征信息,其中,所述语音增强模型包括编码子模型和解码子模型,所述编码子模型用于对所述耳语进行编码,获得目标编码信息,所述解码子模型通过逐步单调注意力机制对所述目标编码信息进行解码,获得所述声学特征信息;
合成模块,用于根据所述声学特征信息进行语音合成,以得到与所述耳语数据对应的音频信息。
第三方面,提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
第四方面,提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。
在上述技术方案中,可以获取待处理的耳语数据,通过语音增强模型对所述耳语数据进行处理,以得到所述耳语数据对应的声学特征信息,并且,在语音增强模型的解码子模型中通过逐步单调注意力机制对耳语数据对应的目标编码信息进行解码,从而获得所述声学特征信息,并根据所述声学特征信息进行语音合成,以得到与所述耳语数据对应的音频信息。由此,通过上述技术方案,可以对耳语数据进行增强,从而可以增加该耳语数据的可懂度,便于用户之间交互和机器识别。并且,可以有效避免解码子模型进行重复解码,降低数据处理量,提高语音增强方法的处理效率;同时可以保证解码获得的声学特征信息的准确性和有序性,保证真实语音的韵律特征,提高语音增强方法获得音频信息的准确性,提高该音频信息的可懂度,进一步提升用户使用体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010773818.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:闸门融冰设备用电热缆末端封口的封装方法
- 下一篇:一种三通球阀