[发明专利]文本转语音的方法、装置、终端设备和存储介质在审

申请号：	202211302137.3	申请日：	2022-10-24
公开（公告）号：	CN115527519A	公开（公告）日：	2022-12-27
发明（设计）人：	杨宗武	申请（专利权）人：	广东小天才科技有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/02;G10L19/02;G10L19/16;G06N3/08;G06N3/04;G06F40/279;G06F40/194
代理公司：	深圳中一联合知识产权代理有限公司 44414	代理人：	姚泽鑫
地址：	523860 广东省东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本语音方法装置终端设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请属于语音播放领域，尤其涉及一种文本转语音的方法、装置、终端设备和存储介质。该方法包括：获取离线时的初始文本；在预设的离线语音包中，根据初始文本确定目标文本，离线语音包包括预设的文本集和对应的离线语音集，目标文本为文本集中与初始文本的相似度大于预设阈值的文本；根据目标文本，从离线语音集中确定与目标文本对应的语音，并将目标文本对应的语音进行播放。即本申请根据在线语音获得离线语音集，在离线语音集中确定目标文本，根据目标文本，从离线语音集中确定与目标文本对应的语音，可以实时播放目标文本对应的语音的同时，减小离线TTS与在线TTS之间的差距，提升离线TTS的播放效果。

技术领域

本申请属于语音播放领域，尤其涉及一种文本转语音的方法、装置、终端设备和存储介质。

背景技术

文本转语音(Text To Speech，TTS)，是一种把文字智能地转化为自然语音的技术。

目前，离线TTS通常是由离线的终端设备本地端通过语音合成算法，将文本合成语音实现的。然而，限于移动终端的中央处理单元(Central Processing Unit，CPU)、图形处理器(Graphics Processing Unit，GPU)、网络处理器(Neural Network Processing Unit，NPU)等计算单元的算力，终端设备无法在保证效果的同时达到实时性，进而导致离线TTS的效果较差，达不到在线TTS的效果。

发明内容

本申请实施例提供一种文本转语音的方法、装置、终端设备和存储介质，可以减小离线TTS与在线TTS之间的差距，提升离线TTS的播放效果。

第一方面，本申请实施例提供一种文本转语音的方法，包括：

获取离线时的初始文本；

在预设的离线语音包中，根据所述初始文本确定目标文本，所述离线语音包包括预设的文本集和对应的离线语音集，所述离线语音集是根据在线语音获得的，所述目标文本为所述文本集中与所述初始文本的相似度大于预设阈值的文本；

根据所述目标文本，从所述离线语音集中确定与所述目标文本对应的语音，并将所述目标文本对应的语音进行播放。

在第一方面的一种可能的实现方式中，在所述获取离线时的初始文本之前，还包括：

获取所述文本集，所述文本集中包括目标文本；

将所述文本集由在线文本到语音工具进行转化，根据转化结果获得所述离线语音包；

或；

将所述文本集在在线语音集中进行检索，根据检索结果获得所述离线语音包。

其中，所述根据所述初始文本确定目标文本，包括：