[发明专利]音质变换系统、音质变换装置及其方法、声道信息生成装置及其方法无效
申请号: | 201280007069.6 | 申请日: | 2012-07-12 |
公开(公告)号: | CN103370743A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 釜井孝浩;广濑良文 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L21/04 | 分类号: | G10L21/04;G10L11/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王成坤;胡建新 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音质 变换 系统 装置 及其 方法 声道 信息 生成 | ||
技术领域
本发明涉及音质变换技术。
背景技术
作为以往的音质变换技术有如下技术,大量准备以互不相同的2种说话方式(例如感情)来发音的相同内容的语音的对,从中学习2种说话方式之间的变换规则的技术(例如,参见专利文献1)。在专利文献1所述的音质变换技术中,能够根据学习模型从无感情语音变换到有感情语音。
在专利文献2所述的音质变换技术中,通过从孤立发音的少量的母音中提取特征量,从而实现向目标语音的变换。
(现有技术文献)
(专利文献)
专利文献1:日本特开平7-72900号公报
专利文献2:国际公开第2008/142836号
发明要解决的课题
然而,在所述的音质变换技术中,有时不能将输入语音变换成流畅自然的语音。
发明内容
于是,本发明提供能够将输入语音变换成流畅自然的语音的音质变换系统。
用于解决课题的手段
本发明的一个实施例涉及的音质变换系统,使用表示声道的形状的声道形状信息,对输入语音的音质进行变换,所述音质变换系统具备:母音接受部,接受种类互不相同的多个母音的语音;分析部,分析由所述母音接受部接受的多个母音的语音,从而按每个所述母音的种类,生成第一声道形状信息;混合部,按每个所述母音的种类,对该母音的所述第一声道形状信息和与该母音不同种类的母音的所述第一声道形状信息进行混合,从而生成该母音的第二声道形状信息;以及合成部,获得输入语音的声道形状信息以及声源信息,通过对所述输入语音中包含的母音的声道形状信息和与所述输入语音中包含的母音相同种类的母音的所述第二声道形状信息进行混合,从而变换所述输入语音的声道形状信息,通过使用变换后的所述输入语音的声道形状信息和所述输入语音的声源信息生成合成音,从而变换所述输入语音的音质。
另外,这些全体或具体的实施例,可以用系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM(Compact Disc Read Only Memory)等记录介质来实现,也可以任意组合系统、方法、集成电路、计算机程序以及记录介质来实现。
根据本发明的一个实施例涉及的音质变换系统能够将输入语音变换为流畅自然的语音。
附图说明
图1是示出母音的谱包络的一例的模式图。
图2A是示出孤立母音的第一峰段频率以及第二峰段频率的分布的图。
图2B是示出文中母音的第一峰段频率以及第二峰段频率的分布的图。
图3是示出人的声道的发音管模型的图。
图4A是示出孤立母音和平均声道形状信息的关系的图。
图4B是示出文中母音和平均声道形状信息的关系的图。
图5A是示出孤立母音的第一峰段频率以及第二峰段频率的平均的图。
图5B是示出文中母音的第一峰段频率以及第二峰段频率的平均的图。
图6是示出文中母音的F1-F2平均、孤立母音的F1-F2平均、以及平均声道形状信息的各自与多个文中母音的第一峰段频率以及第二峰段频率的均方根(Root mean square)误差的图。
图7是用于说明使在F1-F2平面的各孤立母音的位置移动至平均声道形状信息的位置时的效果的图。
图8是实施例1的音质变换系统的构成图。
图9是示出实施例1的分析部的详细构成的一例的图。
图10是表示实施例1的合成部的详细构成的一例的图。
图11A是示出实施例1的音质变换系统的处理工作的流程图。
图11B是示出实施例1的音质变换系统的处理工作的另一流程图。
图12是示出实施例1的音质变换系统的处理工作的流程图。
图13A是示出对日语的输入语音的音质进行变换时的实验结果的图。
图13B是示出对英语的输入语音的音质进行变换时的实验结果的图。
图14是在F1-F2平面配置了英语的13母音的图。
图15是表示实施例1的母音接受部的一例的图。
图16是示出以比率q使所有孤立母音的第一峰段频率以及第二峰段频率移动的情况下在F1-F2平面上形成的多边形的图。
图17是用于说明以声道长变换比率r来使声道截面积函数伸缩的变换方法的图。
图18是用于说明以声道长变换比率r来使声道截面积函数伸缩的变换方法的图。
图19是用于说明以声道长变换比率r来使声道截面积函数伸缩的变换方法的另一图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280007069.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非接触式读卡的校车人员安全管理系统
- 下一篇:计算机散热装置