[发明专利]一种语音合成方法、系统及相关设备在审
申请号: | 202011001059.4 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112102810A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 陈家涛;陈文 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/06;G10L13/10 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 方法 系统 相关 设备 | ||
1.一种语音合成方法,其特征在于,包括:
获取带有音调标注的模板文本对应的第一录音文件;
在所述第一录音文件中提取所述模板文本中带有音调标注的分词的音频信号,并将提取到的音频信号与对应的带有音调标注的分词建立映射关系;
对目标文本中的各个目标分词进行音调标记,并根据所述映射关系提取带有音调标记的各个目标分词的音频信号;
按照各个目标分词的排列顺序将提取到的音频信号合成所述目标文本对应的音频文件。
2.根据权利要求1所述的方法,其特征在于,对目标文本中的各个目标分词进行音调标记,包括:
若识别到预设词库中的语气词,而且所述语气词位于句首或单独出现,则将所述语气词的音调标记为轻声之外的预设音调,所述预设音调与所述语气词的位置关联;或者,
若识别到预设词库中的语气词,而且所述语气词位于句尾,则将所述语气词的音调标记为轻声。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
若识别到预设词库中的变调词汇,则根据所述变调词汇的预存音调进行音调标记。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
若识别到预设词库中包含多音字的词汇,则根据所述包含多音字的词汇的预存音调进行音调标记。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
若识别到“儿”字组成预设儿化音词库中词语,则将所述“儿”字的音调标记为轻声。
6.根据权利要求1至5中任一项所述的方法,其特征在于,根据所述映射关系提取带有音调标记的各个目标分词的音频信号,包括:
获取用户选择的目标录音师对应的身份标识;
根据所述身份标识确定所述目标录音师对应的映射关系,并提取带有音调标记的各个目标分词的音频信号。
7.一种语音合成系统,其特征在于,包括:
获取模块,获取带有音调标注的模板文本对应的第一录音文件;
处理模块,用于在所述第一录音文件中提取所述模板文本中带有音调标注的分词的音频信号,并将提取到的音频信号与对应的带有音调标注的分词建立映射关系;
第一标记模块,用于对目标文本中的各个目标分词进行音调标记;
提取模块,根据所述映射关系提取带有音调标记的各个目标分词的音频信号;
合成模块,用于按照各个目标分词的排列顺序将提取到的音频信号合成所述目标文本对应的音频文件。
8.根据权利要求7所述的系统,其特征在于,所述第一标记模块包括:
第一标记单元,若识别到预设词库中的语气词,而且所述语气词位于句首或单独出现,则将所述语气词的音调标记为轻声之外的预设音调,所述预设音调与所述语气词的位置关联;
第二标记单元,若识别到预设词库中的语气词,而且所述语气词位于句尾,则将所述语气词的音调标记为轻声。
9.根据权利要求7或8所述的系统,其特征在于,还包括:
第二标记模块,若识别到预设词库中的变调词汇,则根据所述变调词汇的预存音调进行音调标记。
10.根据权利要求7至9中任一项所述的系统,其特征在于,还包括:
第三标记模块,若识别到预设词库中包含多音字的词汇,则根据所述包含多音字的词汇的预存音调进行音调标记。
11.根据权利要求7至10中任一项所述的系统,其特征在于,还包括:
第四标记模块,若识别到“儿”字组成预设儿化音词库中词语,则将所述“儿”字的音调标记为轻声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011001059.4/1.html,转载请声明来源钻瓜专利网。