[发明专利]语音合成方法及装置在审
申请号: | 202010880919.X | 申请日: | 2020-08-27 |
公开(公告)号: | CN112002304A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 张进 | 申请(专利权)人: | 上海添力网络科技有限公司 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/04 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 卜荣丽 |
地址: | 201315 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 | ||
本发明提供一种通过在智能设备(包括:各种电脑和移动设备)上实现即时发音的语音合成方法,可以让失语者(无法正常讲话的人)通过敲击键盘与普通人进行语音交流。该编码方案比较简单,就算不使用快捷键的情况下,使用者只需要在键盘上先后敲击三个字母,就能发出一个标准的中文单字音。其中第一个字母标注该发音的声母,第二个字母标注该发音的韵母,第三个字母除了标注好该发音的音调外,还能根据在语句中的位置,标注该发音的轻重长短。如果结合本专利的快捷键和词语编码方法,速度会更快,能够让使用者通过敲击键盘,以普通人的语速和别人进行语音交流。
技术领域
本发明涉及语音生成技术,尤其涉及一种语音合成方法及装置。
本发明涉及电脑输入法和语音合成技术,完整的描述应当是:及时语音合成输入法编码方案。
背景技术
目前市场上已有的语音合成系统都是基于文字转语音的技术(称为TTS,从文本到语音Text To Speech),需要先输入一段文字,然后将这一段文字转换为语音,无法做到同步或者及时发音。
换句话说,如果让一个失语者通过敲击键盘发出语音与普通人交流时,需要先通过键盘输入文字,再使用目前的语音转换系统将整句文字转换成语音发出,该种方式虽然能够解决失语者与常人间的语音交流问题,但是需要将文字作为介质再转换成语音,使得该种方式语音合成方式效率较低,有延时,无法做到及时同步。
发明内容
本发明实施例提供一种语音合成方法及装置,在语音合成的过程中以声码为媒介,不需要文字为媒介,效率较高,语音的输出时刻与使用者的想法产生的时刻能够及时同步。
如果需要同步及时的语音合成,就需要使用本专利的输入法。相对于其他输入法,本专利涉及的输入法准确来讲,是一种配音输入法,即通过敲击键盘,输出语音。相对于本专利的输入法,其它输入法可称之为:配字输入法,即通过敲击键盘,输出文字。
本发明提供一种及时语音合成输入法编码方案,基本方法是在键盘上,先后敲击三个字母,发一个中文语音。扩展方法是使用快捷键和词语输入法,能够平均敲击1.5-2个键,就能发一个中文语音,从而实现使用者可以以正常的语速,通过敲击键盘与别人交流。
本发明实施例的第一方面,提供一种语音合成方法,包括:
接收使用者输入的声母信息;
接收使用者输入的韵母信息;
接收使用者输入的声调信息以及音调的轻重长短信息;
将所述声母信息、韵母信息、声调信息以及音调的轻重长短信息基于声码规则进行融合生成声码信息;
获取与所述声码信息对应的语音信息,其中所述声码信息和语音信息预先对应设置。
可选地,在第一方面的一种可能实现方式中,在所述接收使用者输入的声母信息的步骤前,还包括:
在一输入设备上分别设置声母信息接收区、韵母信息接收区以及声调信息接收区;
当所述输入设备被第一次触发时,所述声母信息接收区获取声母信息;
当所述输入设备被第二次触发时,所述韵母信息接收区获取韵母信息;
当所述输入设备被第三次触发时,所述声调信息接收区获取声调信息。
可选地,在第一方面的一种可能实现方式中,其中,所述声调信息接收区包括句首区、句尾区、词首区、词尾区以及单字区;
所述句首区、句尾区、词首区、词尾区以及单字区分别具有声调的标记位信息;
所述将所述声母信息、韵母信息、声调信息以及音调的轻重长短信息基于声码规则进行融合生成声码信息包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海添力网络科技有限公司,未经上海添力网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010880919.X/2.html,转载请声明来源钻瓜专利网。