[发明专利]韵律编辑装置、方法及程序无效
申请号: | 201310364756.X | 申请日: | 2013-08-20 |
公开(公告)号: | CN103632662A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 森纮一郎;笼岛岳彦;森田真弘 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/08 | 分类号: | G10L13/08 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 陈海红;段承恩 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 编辑 装置 方法 程序 | ||
1.一种韵律编辑装置,其特征在于,包括:
第1选择部,从文本选择含有音素的短语,得到选择短语;
存纳部,对应存纳表示短语相关的属性的属性信息、和1个以上的韵律图形,上述韵律图形表示该短语的韵律的型式,并且表示该短语的韵律的参数包含该短语的音素数以上的要素数;
检索部,从上述存纳部检索上述选择短语和属性信息相一致的上述1个以上的韵律图形,得到韵律图形集合;
标准化部,将上述韵律图形集合中包括的韵律图形分别标准化;
映射部,将标准化的上述韵律图形分别映射在数目比上述要素数少的坐标中表示的低维度空间,生成映射坐标;
显示部,显示上述映射坐标;
第2选择部,得到从上述映射坐标选择的坐标,作为选择坐标;
恢复部,按照上述选择坐标而恢复韵律图形,得到恢复韵律图形;
置换部,根据上述选择短语将生成的合成语音的韵律置换为上述恢复韵律图形。
2.如权利要求1所述的韵律编辑装置,其特征在于,还包括:
生成部,使用统计模型生成上述选择短语相关的韵律图形,将生成的韵律图形追加到上述韵律图形集合。
3.如权利要求1或2所述的韵律编辑装置,其特征在于,还包括:语音合成部,根据上述恢复韵律图形将文本语音合成,生成合成语音。
4.如权利要求1至3中任一项所述的韵律编辑装置,其特征在于,
上述属性信息包含表示上述短语的字符串的表层表现;
上述检索部检索上述选择短语的表层表现和上述短语的表层表现是否相一致。
5.如权利要求1至3中任一项所述的韵律编辑装置,其特征在于,
上述属性信息包含表示上述短语的音素的字符串的音素列;
上述检索部检索上述选择短语的音素列和上述短语的音素列是否相一致。
6.如权利要求1至3中任一项所述的韵律编辑装置,其特征在于,
上述属性信息包含上述短语的短音节数及口音型;
上述检索部检索上述选择短语的短音节数及口音型、和上述短语的短音节数及口音型是否相一致。
7.如权利要求1至6中任一项所述的韵律编辑装置,其特征在于,
上述韵律图形的参数包含音素的基频、音素的持续时间长度及音素的力度;
上述映射部,关于上述基频、上述持续时间长度、和上述力度中的1个以上的参数,独立映射。
8.如权利要求1至6中任一项所述的韵律编辑装置,其特征在于,
上述韵律图形,通过音素的基频、音素的持续时间长度及音素的力度来表现;
上述映射部,将上述基频、上述持续时间长度、和上述力度度的1个以上的参数结合映射。
9.如权利要求1至8中任一项所述的韵律编辑装置,其特征在于,
上述映射部,根据上述映射坐标间的距离将该映射坐标集中,从集中的多个映射坐标中决定代表点;
上述显示部显示上述代表点。
10.如权利要求1至9中任一项所述的韵律编辑装置,其特征在于,
上述恢复部,在上述选择坐标和映射坐标的距离为阈值以内的场合,得到将该映射坐标映射之前的韵律图形作为恢复韵律图形。
11.一种韵律编辑方法,其特征在于,包括:
从文本选择含有音素的短语,得到选择短语;
在存纳装置对应存纳表示短语相关的属性的属性信息、和1个以上的韵律图形,上述韵律图形表示该短语的韵律的型式,并且表示该短语的韵律的参数包含该短语的音素数以上的要素数;
从上述存纳装置检索上述选择短语和属性信息相一致的上述1个以上的韵律图形,得到韵律图形集合;
将上述韵律图形集合中包含的韵律图形分别标准化;
将标准化的上述韵律图形分别映射在数目比上述要素数少的坐标中表示的低维度空间,生成映射坐标;
显示上述映射坐标;
得到从上述映射坐标选择的坐标,作为选择坐标;
按照上述选择坐标而恢复韵律图形,得到恢复韵律图形;
根据上述选择短语将生成的合成语音的韵律置换为上述恢复韵律图形。
12.一种韵律编辑程序,其特征在于,使得计算机作为以下装置起作用,所述装置包括:
第1选择装置,从文本选择含有音素的短语,得到选择短语;
存纳装置,对应存纳表示短语相关的属性的属性信息、和1个以上的韵律图形,上述韵律图形表示该短语的韵律的型式,并且表示该短语的韵律的参数包含该短语的音素数以上的要素数;
检索装置,从上述存纳装置检索上述选择短语和属性信息相一致的上述1个以上的韵律图形,得到韵律图形集合;
标准化装置,将上述韵律图形集合中包括的韵律图形分别标准化;
映射装置,将标准化的上述韵律图形分别映射在数目比上述要素数少的坐标中表示的低维度空间,生成映射坐标;
显示装置,显示上述映射坐标;
第2选择装置,得到从上述映射坐标选择的坐标,作为选择坐标;
恢复装置,按照上述选择坐标而恢复韵律图形,得到恢复韵律图形;
置换装置,根据上述选择短语将生成的合成语音的韵律置换为上述恢复韵律图形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310364756.X/1.html,转载请声明来源钻瓜专利网。