[发明专利]韵律预测方法、装置、设备以及存储介质在审
申请号: | 202011321328.5 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112289305A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 刘世超 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/10;G10L25/27 |
代理公司: | 北京海智友知识产权代理事务所(普通合伙) 11455 | 代理人: | 吴京顺 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 预测 方法 装置 设备 以及 存储 介质 | ||
本申请公开了一种韵律预测方法、装置、设备以及存储介质,涉及语音合成、自然语言处理、计算机技术语言。具体实现方案为:获取目标文本;确定目标文本的语言特征向量;根据目标文本、语言特征向量,确定目标文本中的韵律边界标识;基于韵律边界标识,确定目标文本的韵律,并输出。本实现方式可以对不同语言文本进行快速、准确的韵律预测,提升对不同语言的文本进行韵律预测的速度和精确度。
技术领域
本申请涉及计算机技术领域,具体涉及语音合成、自然语言处理、计算机技术领域,尤其涉及韵律预测方法、装置、设备以及存储介质。
背景技术
语音合成是通过机械的、电子的方法产生人造语音的技术,其目的是能够让计算机将文本信息转化为语音朗读出来,相当于使计算机具有类似于人一样的说话能力。
韵律对于语音信号处理有着至关重要的作用。韵律用于指示对于一个文本而言,在阅读时应该在哪些地方进行停顿。显然,在语言合成过程中,如果能够使得计算机按照自然的韵律进行停顿,将有助于提升语音合成结果的自然度和流畅性。
然而,目前针对多种语言的文本的韵律预测,往往需要单独创建对应于不同语言的前端框架,从而使得韵律预测的流程繁杂,不简洁且韵律预测效果不好。
发明内容
本公开提供了一种韵律预测方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种韵律预测方法,包括:获取目标文本;确定目标文本的语言特征向量;根据目标文本、语言特征向量,确定目标文本中的韵律边界标识;基于韵律边界标识,确定目标文本的韵律,并输出。
在一些实施例中,确定目标文本的语言特征向量,包括:根据目标文本和预训练的分类模型,确定目标文本对应的语言标识,其中预训练的分类模型用于表征文本与语言标识的对应关系;根据目标文本、语言标识和预训练的转换模型,确定目标文本对应的语言特征向量,其中,预训练的转换模型用于表征基于语言标识的文本与语言特征向量的对应关系。
在一些实施例中,确定目标文本中的韵律边界标识,包括:根据目标文本、语言特征向量以及预训练的韵律预测模型,确定目标文本中的韵律边界标识,其中,预训练的韵律预测模型用于表征基于语言特征向量的文本与韵律边界标识的对应关系。
在一些实施例中,根据目标文本、语言特征向量,确定目标文本中的韵律边界标识,包括:根据目标文本和语言特征向量,确定文本分布及上下文信息;基于文本分布及上下文信息和预训练的韵律预测模型,确定目标文本中的韵律边界标识,其中,韵律预测模型用于表征文本分布及上下文信息与韵律边界标识的对应关系。
根据本公开的另一方面,提供了一种用于训练韵律预测模型的方法,包括:获取初始模型,其中,初始模型包括初始韵律预测模型;获取训练样本集合,其中,训练样本集合包括不同语言的文本、标注的各文本对应的语言特征向量以及标注的各文本对应的韵律边界标识;将不同语言的文本以及标注的各文本对应的语言特征向量作为初始模型的输入,将与输入的不同语言的文本以及标注的各文本对应的语言特征向量对应的韵律边界标识作为期望输出,将训练得到的初始模型的初始韵律预测模型确定为韵律预测模型。
在一些实施例中,获取训练样本集合,包括:获取不同语言的文本以及不同语言的文本的语言特征;根据各语言特征和预设的特征与向量的对应关系,确定各语言特征对应的语言特征向量;获取各语言特征向量所对应的文本对应的韵律边界标识;将不同语言的文本、对应不同语言的文本的各语言特征向量以及各韵律边界标识组合成训练样本。
根据本公开的再一方面,提供了一种韵律预测装置,包括:获取单元,被配置成获取目标文本;语言特征向量确定单元,被配置成确定目标文本的语言特征向量;韵律边界标识确定单元,被配置成根据目标文本、语言特征向量,确定目标文本中的韵律边界标识;输出单元,被配置成基于韵律边界标识,确定目标文本的韵律,并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011321328.5/2.html,转载请声明来源钻瓜专利网。