[发明专利]韵律停顿信息的确定方法和装置有效
申请号: | 201510689302.9 | 申请日: | 2015-10-21 |
公开(公告)号: | CN105225658B | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 康永国 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 停顿 信息 确定 方法 装置 | ||
本发明提出一种韵律停顿信息的确定方法和装置,该韵律停顿信息的确定方法包括:提取待合成文本的韵律预测特征;根据所用的发音人选择所述发音人对应的自适应韵律预测模型;将所述待合成文本的韵律预测特征输入到所述发音人对应的自适应韵律预测模型中,以确定所述待合成文本的韵律停顿信息。本发明解决了声学模型和韵律模型两者所用韵律训练数据不一致的问题,改善了韵律节奏,提升了合成流畅度,并且使用发音人各自的自适应韵律预测模型,使得多发音人切换的场合的合成效果更加自然。
技术领域
本发明涉及语音合成技术领域,尤其涉及一种韵律停顿信息的确定方法和装置。
背景技术
语音合成的目的是将文本转换为语音播放给用户,目标是达到真人文本播报的效果。在语音合成环节中一个重要模块是预测待合成文本的韵律停顿,然后根据预测得到的韵律停顿去生成合成语音。
目前语音合成中的韵律预测是基于统计机器学习的方法实现的,其流程包括准备训练数据、训练韵律预测模型和基于训练好的模型进行韵律预测。
但是,现有技术中,韵律预测模型中训练的韵律停顿模式和声学模型训练中的韵律停顿模式是不匹配的。其原因是韵律停顿的训练数据是标注人根据文本标注获得的,而且一般是多个标注人共同标注的结果,因此训练的韵律停顿模型表征的是这些标注人的平均韵律停顿模式;而声学模型训练中输入特征的韵律停顿是根据发音人录音标注来的,即反映的是发音人个人的韵律停顿模式。
另外一个问题是现在的语音合成系统均支持多个发音人,比如男声、女声和童声等,但是目前的解决方案不同发音人对相同文本的韵律停顿是同一个,这也不符合真人发音的特点。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种韵律停顿信息的确定方法。该方法解决了声学模型和韵律模型两者所用韵律训练数据不一致的问题,改善了韵律节奏,提升了合成流畅度,并且使用发音人各自的自适应韵律预测模型,使得多发音人切换的场合的合成效果更加自然。
本发明的第二个目的在于提出一种韵律停顿信息的确定装置。
为了实现上述目的,本发明第一方面实施例的韵律停顿信息的确定方法,包括:提取待合成文本的韵律预测特征;根据所用的发音人选择所述发音人对应的自适应韵律预测模型;将所述待合成文本的韵律预测特征输入到所述发音人对应的自适应韵律预测模型中,以确定所述待合成文本的韵律停顿信息。
本发明实施例的韵律停顿信息的确定方法中,提取待合成文本的韵律预测特征之后,根据所用的发音人选择上述发音人对应的韵律预测模型,然后将上述待合成文本的韵律预测特征输入到上述发音人对应的自适应韵律预测模型中,以确定待合成文本的韵律停顿信息,从而可以解决声学模型和韵律模型两者所用韵律训练数据不一致的问题,改善了韵律节奏,提升了合成流畅度,并且使用发音人各自的自适应韵律预测模型,使得多发音人切换的场合的合成效果更加自然。
为了实现上述目的,本发明第二方面实施例的韵律停顿信息的确定装置,包括:提取模块,用于提取待合成文本的韵律预测特征;选择模块,用于根据所用的发音人选择所述发音人对应的自适应韵律预测模型;确定模块,用于将所述提取模块提取的待合成文本的韵律预测特征输入到所述选择模块选择的所述发音人对应的自适应韵律预测模型中,以确定所述待合成文本的韵律停顿信息。
本发明实施例的韵律停顿信息的确定装置中,提取模块提取待合成文本的韵律预测特征之后,选择模块根据所用的发音人选择上述发音人对应的韵律预测模型,然后确定模块将上述待合成文本的韵律预测特征输入到上述发音人对应的自适应韵律预测模型中,以确定待合成文本的韵律停顿信息,从而可以解决声学模型和韵律模型两者所用韵律训练数据不一致的问题,改善了韵律节奏,提升了合成流畅度,并且使用发音人各自的自适应韵律预测模型,使得多发音人切换的场合的合成效果更加自然。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510689302.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音系统的适应方法和系统
- 下一篇:像素结构及像素排列用数据转换方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置