[发明专利]韵律预测方法、装置、设备和介质有效
申请号: | 201911072965.0 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110797005B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 高占杰;聂志朋;卞衍尧;陈昌滨 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/08;G06F40/289;G06N20/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 预测 方法 装置 设备 介质 | ||
本申请实施例公开了一种韵律预测方法、装置、设备和介质,涉及数据处理领域,尤其涉及语音合成技术。该方法包括:对待预测的中英混合文本进行切分,得到中文文本和英文文本;确定中文文本中文字的字向量和英文文本中单词的词向量;根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。本申请实施例提供了一种韵律预测方法、装置、设备和介质,提高了对中英混合文本的韵律预测准确率。
技术领域
本申请实施例涉及数据处理领域,尤其涉及语音合成技术。具体地,本实施例提供了一种韵律预测方法、装置、设备和介质。
背景技术
在语音合成前,需要对语音的文本进行韵律预测。
现有韵律预测方法包括:通过机器学习方法根据预先训练的预测模型对待预测的文本内容进行预测,获取该文本内容对应的停顿预测结果,其中,停顿预测结果可包括停顿位置,停顿类型(可包括长停顿、短停顿等)以及与停顿类型相对应的概率值。
上述方案存在如下缺陷:
对待预测的文本内容不进行语言种类的区分,当文本内容既包括中文又包括英文,也即待预测文本为中英混合文本时,很可能直接将英文单词看作多个字母进行处理。然而,直接将英文单词看作多个字母进行处理,会丢失单词的语义信息,从而降低了文本韵律预测的准确率。
发明内容
本申请实施例提供了一种韵律预测方法、装置、设备和介质,以提高对中英混合文本的韵律预测准确率。
本申请实施例提供了一种韵律预测方法,该方法包括:
对待预测的中英混合文本进行切分,得到中文文本和英文文本;
确定中文文本中文字的字向量和英文文本中单词的词向量;
根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果。
本申请实施例可以实现如下技术效果,通过对待预测的中英混合文本进行切分,得到中文文本和英文文本;根据中文文本中文字的字向量和英文文本中单词的词向量,确定所述中英混合文本的韵律预测结果,从而实现对中英文混合文本的韵律预测。
并且,根据英文文本中单词的词向量,确定所述中英混合文本中英文文本的韵律预测结果,因为单词的词向量中保留了单词的语义信息,所以本申请实施例可以提高对中英混合文本中英文文本韵律预测的准确率。
进一步地,所述根据确定的字向量和词向量,确定所述中英混合文本的韵律预测结果,包括:
根据文字和单词在所述中英混合文本中的位置,对所述文字的字向量和所述单词的词向量进行排序,生成文本向量序列;
根据所述文本向量序列确定所述中英混合文本的韵律预测结果。
基于该技术特征,本申请实施例可以实现如下效果:通过根据所述文本向量序列确定所述中英混合文本的韵律预测结果,从而实现结合文字和单词在所述中英混合文本中的位置,确定中英混合文本的韵律预测结果,进而提高韵律预测结果的准确率。
进一步地,所述确定英文文本中单词的词向量,包括:
将英文文本中的单词切分为字母序列;
确定所述字母序列中字母的字母向量;
根据确定的字母向量,提取表示单词语义的词向量。
基于该技术特征,本申请实施例的技术方案可以实现如下效果:通过将英文文本中的单词切分为字母序列;确定所述字母序列中字母的字母向量;根据确定的字母向量,提取表示单词语义的词向量,从而实现对词典中没有的新型单词的词向量的确定,进而实现对新型单词的韵律预测。
进一步地,所述根据确定的字母向量,提取表示单词语义的词向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911072965.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据传输方法和装置
- 下一篇:端到端的语音合成方法、装置及存储介质