[发明专利]声音合成装置、声音合成方法及程序在审
申请号: | 201780088311.X | 申请日: | 2017-09-26 |
公开(公告)号: | CN110431621A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 森田真弘;森纮一郎;大谷大和 | 申请(专利权)人: | 东芝数字解决方案株式会社 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/047;G10L13/06 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 讲话 判定部 声音合成装置 参数存储部 参数控制部 声音合成部 判定 合成声音 声音合成 数值控制 存储 | ||
实施方式的声音合成装置具有声音合成部(10)、讲话者参数存储部(50)、可否利用判定部(60)和讲话者参数控制部(40)。声音合成部(10)能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性。讲话者参数存储部(50)存储已登记讲话者参数值。可否利用判定部(60)根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定所输入的讲话者参数值的可否利用。讲话者参数控制部(40)禁止或者限制通过所述可否利用判定部(60)被判定为不可以利用的讲话者参数值的利用。
技术领域
本发明的实施方式涉及声音合成装置、声音合成方法及程序。
背景技术
在声音合成中具有这样的需求,对于所生成的合成声音的讲话者,不仅从事前准备的少数候选中进行选择,而且想要重新生成适合于想阅读的内容的讲话者特性或利用者独自的讲话者特性。作为应对此需求的手段,例如提出了根据与讲话者特性相关的参数的操作使生成新的讲话者特性的技术。
随着这种技术的性能提高,在利用者想要自由地生成原创性较高的各种各样的讲话者特性时,可以预见想要把新生成的讲话者特性作为独自的讲话者特性而独占利用的需求高涨。但是,存在与某一利用者生成的讲话者特性相同或者相似的讲话者特性偶然地由其他利用者生成并在实际的产品/服务等中使用的可能性,而不能应对那样的需求。
现有技术文献
专利文献
专利文献1:日本专利第4296231号公报
发明内容
发明要解决的课题
本发明要解决的课题是,提供能够实现讲话者特性的独占利用的声音合成装置、声音合成方法及程序。
用于解决课题的手段
实施方式的声音合成装置具有声音合成部、讲话者参数存储部、可否利用判定部和讲话者参数控制部。声音合成部能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性。讲话者参数存储部存储已登记讲话者参数值。可否利用判定部根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定所输入的讲话者参数值的可否利用。讲话者参数控制部禁止或者限制通过所述可否利用判定部被判定为不可以利用的讲话者参数值的利用。
附图说明
图1是表示有关第1实施方式的声音合成装置的功能性结构例的框图。
图2是表示声音合成部和声音合成模型存储部的结构例的框图。
图3是表示将讲话者参数值转换成子模型的加权的具体例的图。
图4是表示在讲话者参数存储部存储的信息的一例的图。
图5是表示可否利用判定部的处理步骤的一例的流程图。
图6是表示用户界面的画面结构例的图。
图7是表示用户界面的画面结构例的图。
图8是表示用户界面的画面结构例的图。
图9是表示用户界面的画面结构例的图。
图10是表示用户界面的画面结构例的图。
图11是表示用户界面的画面结构例的图。
图12是表示有关第2实施方式的声音合成装置的功能性结构例的框图。
图13是表示可否利用的判定和可否登记的判定的差异的概念图。
图14是表示用户界面的画面结构例的图。
图15是表示用户界面的画面结构例的图。
图16是表示用户界面的画面结构例的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东芝数字解决方案株式会社,未经东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780088311.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吸音材料和车辆部件
- 下一篇:语音对话方法及语音对话装置