[发明专利]语音合成模型训练和语音合成方法、装置、设备及介质在审
申请号: | 202011549430.0 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112634866A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 张大成;刘欢 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/047 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张燕 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 模型 训练 方法 装置 设备 介质 | ||
本发明公开了一种语音合成模型训练和语音合成方法、装置、设备及介质。由于样本集中的任一第一语音样本对应的文本特征,均是根据预先配置的第一语言的语音单元集合与第二语言的语音单元集合的对应关系确定的,从而实现了将第一语音样本转换为第二语言的语音样本,增加了第二语言的语音样本的数量,后续基于样本集中的第一语音样本对应的文本特征样本和第一语音样本的第一声学特征,即可对原始语音合成模型进行训练,从而获取到第二语言对应的目标语音合成模型,从而实现无需大量的采集第二语言的语音样本,即可获取到第二语言的目标语音合成模型。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音合成模型训练和语音合成方法、装置、设备及介质。
背景技术
随着文本转语音(Text to Speech,TTS)技术的发展,越来越多的领域采用该种技术,以提高用户的体验。比如,通过预先设置智能设备上语音助手对某一问题的回答内容,以使后续用户在请求语音助手回答该问题时,即可输出语音形式的回答内容。现有技术中,可以通过预先训练完成的语音合成模型,生成文本信息对应的声学特征。后续基于该声学特征,进行相应的处理,从而得到文本信息对应的语音信息。如果希望可以将任一文本信息转化成自然、准确的语音信息,则需要基于大量的预先标记好的语音样本,对该语音合成模型进行训练,以提高该语音合成模型输出文本信息对应的声学特征的准确度。而近几年来,为了进一步提高用户的体验,并可以为用户提供个性化的服务,如何将文本信息转化成语音为方言的语音信息成为人们日益关注的问题。
为了可以将任一文本信息转化成自然、准确的语音为方言的语音信息,基于现有技术中的方法,需要预先采集大量的后,基于语音为某一方言的语音样本,对原始语音合成模型进行训练,后续才能根据文本信息的文本特征以及训练完成的语音合成模型获取到可以准确预测该方言的语音信息的声学特征。由于一般需要预先采集3万句以上、或者30小时以上的该方言的语音样本,才能保证该语音合成模型的准确性,导致获取到用于训练该方言的语音合成模型的语音样本的难度以及所耗费的成本都非常的大。
发明内容
本发明实施例提供了一种模型训练和语音合成方法、装置、设备及介质,用以解决现有获取到可以预测方言的语音信息的声学特征的语音合成模型的难度、以及所耗费的成本非常大的问题。
本发明实施例提供了一种语音合成模型训练方法,所述方法包括:
获取包含至少一个第一语音样本的样本集,所述第一语音样本为采用第一语言的语音样本,所述第一语音样本对应的文本特征样本是根据预先配置的第一语言的语音单元集合与第二语言的语音单元集合的对应关系确定的;
基于所述样本集中的第一语音样本对应的文本特征样本和所述第一语音样本的第一声学特征,对原始语音合成模型进行训练,以获取所述第二语言对应的目标语音合成模型。
本发明实施例提供了一种语音合成模型训练方法,所述方法包括:
获取包含至少一个语音样本的样本集,所述语音样本包括采用第一语言的第一语音样本和采用第二语言的第二语言样本;
基于所述样本集中的第一语音样本对应的第一文本特征和所述第一语音样本的第一声学特征,以及所述样本集中的第二语音样本对应的第二文本特征和所述第二语音样本的第二声学特征,对所述原始语音合成模型进行训练,得到基础语音合成模型;其中,所述第一文本特征是基于所述第一语言的语音单元集合确定的,所述第二文本特征是基于所述第二语言的语音单元集合确定的;
基于所述第二语音样本对应的第二文本特征和所述第二语音样本的第二声学特征,对所述基础语音合成模型进行训练,得到目标语音合成模型。
本发明实施例提供了一种基于上述任一语音合成模型训练方法获取到的目标语音合成模型的语音合成方法,所述方法包括:
获取文本信息的文本特征,所述文本特征是基于所述第二语言的语音单元集合确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011549430.0/2.html,转载请声明来源钻瓜专利网。