[发明专利]用于语音合成的文本分析方法、装置、服务器和介质在审
申请号: | 202011240517.X | 申请日: | 2020-11-09 |
公开(公告)号: | CN112364653A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 刘世超 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F9/52;G06N3/04;G06N3/08;G10L13/10 |
代理公司: | 北京海智友知识产权代理事务所(普通合伙) 11455 | 代理人: | 吴京顺 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 合成 文本 分析 方法 装置 服务器 介质 | ||
1.一种用于语音合成的文本分析方法,包括:
获取待合成语音的文本;
将所述待合成语音的文本输入至预先训练的文本分析模型,得到文本分析结果,其中,所述文本分析模型包括特征共享层和至少两个子任务模型,所述文本分析结果包括所述待合成语音的文本中与所述至少两个子任务模型对应输出的标签。
2.根据权利要求1所述的方法,其中,所述文本分析模型通过以下步骤训练得到:
获取训练样本集合,其中,所述训练样本集合中的训练样本包括用于训练所述至少两个子任务模型的样本输入和样本标注信息;
将所述训练样本集合中的训练样本的样本输入作为输入,将与输入的样本输入对应的样本标注信息作为期望输出,训练得到所述文本分析模型。
3.根据权利要求1所述的方法,其中,所述至少两个子任务模型中包括韵律预测模型;所述韵律预测模型中包括字符向量表示网络和序列标注网络。
4.根据权利要求3所述的方法,其中,用于训练所述韵律预测模型的样本输入和样本标注信息包括样本文本和与样本文本对应的韵律停顿标注。
5.根据权利要求4所述的方法,其中,所述字符向量表示网络包括BERT模型,所述序列标注网络包括长短期记忆网络和条件随机场层。
6.根据权利要求5所述的方法,其中,所述特征共享层包括所述BERT模型、长短期记忆网络和条件随机场层中的至少一项。
7.根据权利要求1-6之一所述的方法,其中,所述至少两个子任务模型中还包括以下至少两项:分词模型,词性标注模型,命名实体识别模型,多音字发音预测模型。
8.一种用于语音合成的文本分析装置,包括:
获取单元,被配置成获取待合成语音的文本;
分析单元,被配置成将所述待合成语音的文本输入至预先训练的文本分析模型,得到文本分析结果,其中,所述文本分析模型包括特征共享层和至少两个子任务模型,所述文本分析结果包括所述待合成语音的文本中与所述至少两个子任务模型对应输出的标签。
9.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011240517.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水箱活块定位结构及坐便器模具
- 下一篇:一种半导体器件及其制备方法