[发明专利]语音合成装置及其控制方法在审
申请号: | 201510791532.6 | 申请日: | 2015-11-17 |
公开(公告)号: | CN105609097A | 公开(公告)日: | 2016-05-25 |
发明(设计)人: | 权哉成 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L13/047 | 分类号: | G10L13/047 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王波波 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 装置 及其 控制 方法 | ||
相关申请的交叉引用
本申请要求于2014年11月17日提交的韩国专利申请No.10-2014-0159995的优先 权,该公开内容以全文引用的方式并入本文中。
技术领域
根据本公开的各种实施例的装置和方法涉及语音合成装置及其控制方法,更具体 地,涉及用于将输入文本转换成语音的语音合成装置及其控制方法。
背景技术
近来,随着语音合成技术的发展,在各种语音引导领域、教育领域等中,语音合成 技术得到了广泛的使用。语音合成是用于产生与人类讲话的声音类似的声音的技术,并且 还常被称为文本到语音(TTS)系统。语音合成技术向用户发送作为语音信号的信息,而不是 文本或图片,因此当用户不能看见操作机器的屏幕时(如用户正在驾驶或用户是盲人的情 况),这将非常有用。近来,智能家庭中的家用智能设备(比如智能电视(TV)或智能冰箱)或 个人便携设备(比如智能电话、电子书阅读器或车辆导航设备)都非常活跃地发展并且已经 变得广泛流行。从而,对语音合成技术和语音输出装置的需求激增。
在这点上,需要一种用于加强合成语音的声音质量的方法,具体地,需要一种用于 生成具有极佳逼真度的合成语音的方法。
发明内容
本公开的示例实施例克服上述缺点和上面未描述的其它缺点。此外,不要求本公 开的实施例克服上述缺点,且本公开的示例实施例可以不克服上述任何问题。
本公开的各种实施例提供了语音合成装置及其控制方法,用于补偿使用基于隐马 尔科夫模型(HMM)语音合成方案所生成的语音中的各种韵律修改,以生成逼真的合成语音。
根据本公开的各实施例的一个方案,一种用于将输入文本转换成语音的语音合成 装置包括:语音参数数据库,被配置为存储与构成语音文件的语音合成单元分别对应的多 个参数;输入单元,被配置为接收包括多个语音合成单元在内的文本;以及处理器,被配置 为从语音参数数据库中选择与构成所述输入文本的多个语音合成单元分别对应的多个候 选单元参数,以根据连续级联候选单元参数之间的级联概率来生成部分或全部所述文本的 参数单元序列,以及使用参数单元序列来执行基于隐马尔科夫模型(HMM)的合成操作,以生 成与所述文本相对应的声学信号。
所述处理器可以顺序组合候选单元参数,根据候选单元参数之间的级联概率来搜 索候选单元参数的级联路径,以及组合与所述级联路径相对应的候选单元参数,以生成部 分或全部所述文本的参数单元序列。
语音合成装置还可包括存储装置,所述存储装置被配置为存储激励信号模型,其 中,所述处理器可以将所述激励信号模型应用到所述文本,以生成与所述文本相对应的HMM 语音参数,以及将所述参数单元序列应用到所生成的HMM语音参数,以生成声学信号。
所述存储装置还可存储为了执行合成操作所需要的频谱模型,以及所述处理器可 将所述激励信号模型和所述频谱模型应用到所述文本,以生成与所述文本相对应的HMM语 音参数。
根据本公开的各实施例的另一方面,一种用于将输入文本转换为语音的语音合成 装置的控制方法包括:接收包括多个语音合成单元在内的文本;从用于存储与构成语音文 件的语音合成单元相对应的多个参数的语音参数数据库中选择多个候选单元参数,所述多 个候选单元参数与构成所述输入文本的多个语音合成单元分别对应;根据连续级联候选单 元参数之间的级联概率来生成部分或全部所述文本的参数单元序列;以及使用所述参数单 元序列来执行基于隐马尔科夫模型(HMM)的合成操作,以生成与所述文本相对应的声学信 号。
生成参数单元序列可包括:顺序组合与所述多个语音合成单元分别对应的多个候 选单元参数并根据候选单元参数之间的级联概率来搜索候选单元参数的级联路径,以及组 合与所述级联路径相对应的候选单元参数,以生成部分或全部所述文本的参数单元序列。
生成声学信号可包括:将激励信号模型应用到所述文本,以生成与所述文本相对 应的HMM语音参数,以及将所述参数单元序列应用到所生成的HMM语音参数,以生成声学信 号。
搜索候选单元参数的级联路径可使用借助viterbi算法的搜索方法。
生成HMM语音参数还可包括:将为了执行合成操作所需要的频谱模型应用到所述 文本,以生成与所述文本相对应的HMM语音参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510791532.6/2.html,转载请声明来源钻瓜专利网。