[发明专利]声音合成装置、声音合成方法及程序在审
申请号: | 201780088311.X | 申请日: | 2017-09-26 |
公开(公告)号: | CN110431621A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 森田真弘;森纮一郎;大谷大和 | 申请(专利权)人: | 东芝数字解决方案株式会社 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/047;G10L13/06 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 讲话 判定部 声音合成装置 参数存储部 参数控制部 声音合成部 判定 合成声音 声音合成 数值控制 存储 | ||
1.一种声音合成装置,具有:
声音合成部,能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性;
讲话者参数存储部,存储已登记讲话者参数值;
可否利用判定部,根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定可否利用所输入的讲话者参数值;
讲话者参数控制部,禁止或者限制通过所述可否利用判定部判定为不可利用的讲话者参数值的利用。
2.根据权利要求1所述的声音合成装置,
所述声音合成装置还具有存储声音合成模型的声音合成模型存储部,所述声音合成模型包括将成为基础的讲话者特性模型化得到的基础模型、和将讲话者特性的各要素的特点模型化得到的讲话者特性控制模型,
所述声音合成部包括:选择部,从所述基础模型和所述讲话者特性控制模型中选择多个统计量;相加部,按照所指定的讲话者参数值对所述统计量进行加权相加,所述声音合成部使用通过所述相加部进行加权相加得到的统计量生成所述合成声音的声音波形。
3.根据权利要求1或2所述的声音合成装置,
所述可否利用判定部根据规定的函数计算所输入的讲话者参数值与已登记讲话者参数值的差异,在所计算出的差异为表示已登记讲话者参数值的登记范围的第1阈值以下的情况下,将所输入的讲话者参数值判定为不可利用。
4.根据权利要求3所述的声音合成装置,
所述讲话者参数存储部还存储已登记讲话者参数值固有的所述第1阈值。
5.根据权利要求3或4所述的声音合成装置,
所述可否利用判定部将所输入的讲话者参数值和已登记讲话者参数值分别映射在共同的讲话者参数空间中,在该讲话者参数空间中计算所输入的讲话者参数值与已登记讲话者参数值的差异。
6.根据权利要求1~5中任意一项所述的声音合成装置,
所述声音合成装置还具有讲话者参数登记部,将所输入的讲话者参数值登记在所述讲话者参数存储部中,
所述讲话者参数控制部根据来自利用者的登记申请,对所述讲话者参数登记部输出讲话者参数值的登记指示。
7.根据权利要求6所述的声音合成装置,
所述可否利用判定部还判定可否登记所输入的讲话者参数值,
在通过所述可否利用判定部判定为可以登记的情况下,所述讲话者参数控制部对所述讲话者参数登记部输出所输入的讲话者参数值的登记指示。
8.根据权利要求7所述的声音合成装置,
所述可否利用判定部根据规定的函数计算所输入的讲话者参数值与已登记讲话者参数值的差异,在所计算出的差异为第3阈值以下的情况下,将所输入的讲话者参数值判定为不可登记,所述第3阈值是将表示已登记讲话者参数值的登记范围的第1阈值与表示所输入的讲话者参数值的登记范围的第2阈值相加得到的。
9.根据权利要求8所述的声音合成装置,
当存在与所输入的讲话者参数值的差异超过所述第1阈值但是在所述第3阈值以下的已登记讲话者参数值的情况下,所述可否利用判定部询问利用者是否登记以使所述差异超过所述第3阈值的方式被调整后的讲话者参数值,
在利用者进行了所述被调整后的讲话者参数值的登记申请的情况下,所述参数控制部对所述讲话者参数登记部输出所述被调整后的讲话者参数值的登记指示。
10.根据权利要求8所述的声音合成装置,
当存在与所输入的讲话者参数值的差异超过所述第1阈值但是在所述第3阈值以下的已登记讲话者参数值的情况下,所述可否利用判定部询问利用者是否以使所述差异超过所述第3阈值的方式缩窄所输入的讲话者参数值的登记范围而进行登记,
在利用者进行了缩窄登记范围的讲话者参数的登记申请的情况下,所述参数控制部对所述讲话者参数登记部输出缩窄登记范围的讲话者参数值的登记指示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东芝数字解决方案株式会社,未经东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780088311.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:吸音材料和车辆部件
- 下一篇:语音对话方法及语音对话装置