[发明专利]韵律模型的构建方法和装置、韵律标注方法、电子设备在审
申请号: | 202211117014.2 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115470351A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 冯小琴;张济鹏;陈云琳;叶顺平 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G10L13/10 |
代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 韩德凯 |
地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 模型 构建 方法 装置 标注 电子设备 | ||
本申请提供了一种韵律模型的构建方法和装置、韵律标注方法、电子设备,包括:获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本,其中输入数据的韵律等级高于各个前序分类器对应的韵律等级;基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器;以及整合各个前序分类器和目标分类器,获得韵律模型。
技术领域
本申请涉及智能语音技术领域,特别涉及一种韵律模型的构建方法、韵律模型的构建装置、韵律标注方法、电子设备以及可读存储介质。
背景技术
对文本的韵律等级的精准把控是提高语音合成自然度的关键,因此在语音合成的过程中,通常利用韵律模型对文本的韵律等级进行分析,以确定输入文本的韵律结构。显而易见地,韵律模型在韵律等级的获取过程至关重要。
但是,在韵律模型训练的过程中,需要大量的训练样本的支持,而具备各个韵律等级标注的联合韵律数据的生成依赖于专家经验,其获取难度较大。另外,常规的韵律模型在进行文本特征的提取时,提取的效率较低,不能满足工业场景中对文本进行批量化的韵律结构预测的需求。
发明内容
为了解决上述技术问题中的至少一个,本申请提供了一种韵律模型的构建方法、韵律模型的构建装置、韵律标注方法、电子设备以及可读存储介质。
本申请的一个方面提供了一种韵律模型的构建方法,可包括:获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本,其中输入数据的韵律等级高于各个前序分类器对应的韵律等级;基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器;整合各个前序分类器和目标分类器,获得韵律模型。
在一些实施方式中,基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器,可包括:利用初始分类器对输入数据的训练文本和各个前序标注文本分别进行韵律标注,以获得多个对应于输入数据的韵律等级的韵律标注文本;将各个韵律标注文本分别与输入数据的预期标注结果进行比对,分别获得多个标注误差;根据各个标注误差对初始分类器进行参数调整;以及响应于各个标注误差均小于误差阈值的比对结果,获得目标分类器,其中目标分类器生成的韵律标注文本与输入数据的预期标注结果之间的标注误差小于误差阈值。
在一些实施方式中,在获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本之前,还可包括:利用前序数据对另一初始分类器进行参数调整,以获得前序分类器,其中前序分类器生成的标注结果与前序数据的预期标注结果之间的标注误差小于前序误差阈值。
在一些实施方式中,在获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本之前,可包括:利用输入数据对初始提取模块进行参数调整,以获得用于提取表征输入数据的文本特征的特征向量的语义提取模块。
在一些实施方式中,在利用输入数据对初始提取模块进行参数调整,以获得用于提取表征输入数据的文本特征的特征向量的语义提取模块之后,可包括:对语义提取模块进行蒸馏,以获得用于提取特征向量的目标提取模块。
在一些实施方式中,在获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本之前,可包括:提取用于表征输入数据的文本特征的特征向量。
本申请的另一个方面提供了一种韵律模型的构建装置,可包括:输入数据获取模块,用于获取输入数据,以及各个前序分类器对输入数据中训练文本的前序标注文本,其中输入数据的韵律等级高于各个前序分类器对应的韵律等级。目标分类器生成模块,用于基于输入数据和多个前序标注文本,对初始分类器进行参数调整,以获得目标分类器。韵律模型构建模块,用于整合各个前序分类器和目标分类器,获得韵律模型。
本申请的又一个方面提供了一种韵律标注方法,可包括:获取目标文本;利用韵律模型对目标文本进行韵律标注,其中韵律模型由上述实施方式中任一项所述的韵律模型的构建方法构建;以及生成目标文本的韵律标注文本,其中韵律标注文本具备对应于至少一个韵律等级的标注信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211117014.2/2.html,转载请声明来源钻瓜专利网。