[发明专利]用力声音转换装置、声音转换装置、声音合成装置、声音转换方法、声音合成方法及程序有效
申请号: | 200880001051.9 | 申请日: | 2008-01-22 |
公开(公告)号: | CN101606190A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 加藤弓子;釜井孝浩 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L21/04 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 黄剑锋 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用力 声音 转换 装置 合成 方法 程序 | ||
技术领域
本发明涉及生成具有与正常的发音不同特点的声音的“用力”声音的技术。这种“用力”声音包括:(i)人在怒吼的时候、为了强调而用力加强语气讲话时、在兴奋或紧张的状态下讲话时等出现的嘶哑的声音、粗鲁的声音、刺耳的声音(harsh voice);(ii)例如在唱演歌时出现的“颤音(こぶし)”或“哼声(うなり)”;或者(iii)例如在演唱布鲁斯歌曲或摇滚乐曲等时出现的“喊叫声”。本发明尤其涉及声音转换装置以及声音合成装置,能够生成如上述声音所包含的、(i)愤怒、重音、强有力以及精力充沛的感情;(ii)声音的表现力;(iii)说话风格;或者(iv)讲话者的态度、状况或发音器官的紧张状态等能够表达的声音。
背景技术
以往,开发了以声音来表达感情、表现力、态度及状况等的、尤其不是以语言的声音来表达,而是通过所谓口气、说话的方式及声调之类的副语言的表达来表达感情等为目的声音转换或者声音合成的技术。这些技术对于从机器人或者电子秘书到电子设备的声音对话接口都是必不可少的。
在声音的副语言的表达之中,存在许多有关改变韵律模式的方法的提案。具有如下的方法:根据模型生成基频模式、强度模式以及节奏模式等韵律模式,按照要以声音来表达的感情,通过以周期性波动信号来修正基频模式和强度模式,从而生成带有要表达的感情的声音的韵律模式(例如,参考专利文献1)。在依据韵律模式的修正的感情声音的生成方法中,还如专利文献1的第0118段所指出的,为了防止由于起伏而产生的音质变化,需要超出音节的时间长度周期的周期性波动信号。
另一方面,作为实现根据音质的表达的方法,开发有以下的方法:分析被输入的声音以求出合成参数,改变此参数以改变音质的声音转换方法(例如,参考专利文献2),以及生成将标准的声音或无表现力的声音合成 的参数,并改变此参数的声音合成方法(例如,参考专利文献3)。
而且,在波形连接方式的声音合成技术中,先将标准的声音或无表现力的声音合成,并从带感情等的具有表现力的声音之中选择具备与此合成音相似的特征矢量的声音并连接的技术被提案(例如,参考专利文献4)。
进而,根据通过分析自然声音而得到的合成参数,在依据统计学习模型生成合成参数的声音合成技术中,根据包含各种感情表达方式的自然声音,对分别对应于各种感情的声音生成模型进行统计性的学习,并准备模型之间的转换公式,将标准的声音或者无表现力的声音转换为表达感情的声音的方式被提案。
但是,上述以往的方式(方法)之中,在进行合成参数的改变的技术中,按照以每种感情预先规定了的同样的转换规则进行参数转换。因此,这种技术不能够再现自然说话中所能见到的出现如一部分是用了力的声音的音质的变化。
而且,在将与标准声音类似的带有特征矢量的感情等具有表现力的声音抽取并连接的方式中,不容易选择与正常的发音大不相同的、象“用力声音”那样具有特点的特殊音质的声音。因此,从结果来看,这种方式不能再现自然说话中所能见到的音质的变化。
还有,在根据包含感情表达的自然声音学习统计性的声音合成模型的方式中,虽然也有可能学习音质的变化,但是表达感情的声音中的有特点的音质的声音,其出现频率低而难以学习。例如,上述的“用力声音”、很有礼貌地且和气地说话时特征性地出现的如耳语一般的声音(whispery voice),以及被称为柔和的声音的气嗓音(breathy)或者被称为“嘶哑的声音”的送气的声音(参考专利文献4、专利文献5),由于通过其具有特点的音质来吸引听众的注意力,因而印象深刻,大大影响说话整体的印象。但是,这些声音只是出现在实际的整体声音的一部分中,出现频率不高。从整体的发音时间来看,由于其时间比率小,在进行统计性的学习的情况下,再现“用力声音”以及“嘶哑的声音”等的模型很难学习。
即,在上述以往的方法中,存在难以再现一部分的音质的变化,不能丰富地表达具有细微的时间结构的、并具有质感的、逼真的表现力的问题。
于是,为了解决上述问题,并为了再现音质的变化,可以考虑专门对特殊音质的声音进行音质转换的方式。有关成为音质转换的基础的音质的 物理特征,进行了与本申请所设定的对象的“用力声音”具有不同定义的“用力”声音和上述“嘶哑”声音的研究。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880001051.9/2.html,转载请声明来源钻瓜专利网。