[发明专利]用于合成语音的方法和装置有效
申请号: | 201910579495.0 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110197655B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 李飞亚;李昊;王振宇;侯建康 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 合成 语音 方法 装置 | ||
本申请实施例公开了用于合成语音的方法和装置。该方法的一具体实施方式包括:接收语音合成请求,其中,语音合成请求包括语音合成文本和方言标识;按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音;输出方言语音。该实施方式提高了语音合成所生成的语音的多样性。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于合成语音的方法和装置。
背景技术
文本到语音(Text To Speech,TTS)又称语音合成,是一种将文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。现有的语音合成应用包括语音驱动的邮件以及声音敏感系统,并常与声音识别程序一起使用。
发明内容
本申请实施例提出了用于合成语音的方法和装置。
第一方面,本申请实施例提供了一种用于合成语音的方法,包括:接收语音合成请求,其中,语音合成请求包括语音合成文本和方言标识;按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音;输出方言语音。
在一些实施例中,按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音,包括:将语音合成文本输入到预先训练的、方言标识所对应的语音合成模型中,得到方言语音。
在一些实施例中,方言发音特征包括方言特点词;以及按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音,包括:确定语音合成文本是否包括至少一个方言特点词;若是,则针对至少一个方言特点词中的每个方言特点词,将语音合成文本中的该方言特点词按照该方言特点词所对应的发音信息转换成方言语音。
在一些实施例中,将语音合成文本中的该方言特点词按照该方言特点词所对应的发音信息转换成方言语音,包括:响应于确定出该方言特点词对应至少两个发音信息,基于预设的发音影响信息,确定该方言特点词在语音合成文本中的发音信息,其中,发音影响信息包括以下至少一项:该方言特点词在语音合成文本中的位置、该方言特点词在语音合成文本中的上下文信息和该方言特点词在语音合成文本中的词性;将语音合成文本中的该方言特点词按照所确定出的发音信息转换成方言语音。
在一些实施例中,方言发音特征包括方言规则,方言规则包括方言习惯规则和/或方言特殊规则;以及按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音,包括:对语音合成文本进行分析得到分析结果;按照方言规则,基于分析结果,将语音合成文本转换成方言文本,以及将方言文本转换成方言语音。
在一些实施例中,按照方言规则,基于分析结果,将语音合成文本转换成方言文本,以及将方言文本转换成方言语音,包括:按照方言规则,基于分析结果,确定待添加的方言词语、方言词语在语音合成文本中的位置以及待添加的方言词语的发音信息;按照确定出的位置在语音合成文本中添加待添加的方言词语,生成第一方言文本;按照待添加的方言词语的发音信息,将第一方言文本转换成方言语音。
在一些实施例中,按照方言规则,基于分析结果,将语音合成文本转换成方言文本,以及将方言文本转换成方言语音,包括:按照方言规则,基于分析结果,确定语音合成文本中的待被替换的词语、待替换的方言词语以及待替换的方言词语的发音信息;将语音合成文本中的待被替换的词语替换成待替换的方言词语,生成第二方言文本;按照待替换的方言词语的发音信息,将第二方言文本转换成方言语音。
第二方面,本申请实施例提供了一种用于合成语音的装置,包括:接收单元,被配置成接收语音合成请求,其中,语音合成请求包括语音合成文本和方言标识;转换单元,被配置成按照方言标识所指示的方言的方言发音特征,将语音合成文本转换成方言语音;输出单元,被配置成输出方言语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910579495.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声学装置及制备方法
- 下一篇:一种可快速记录会议内容并转换成文字的设备