[发明专利]语音处理装置在审
申请号: | 202210403587.5 | 申请日: | 2015-09-16 |
公开(公告)号: | CN114694632A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 田村正统;森田真弘 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/06;G10L25/18 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 万利军;段承恩 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 装置 | ||
能使波形的再现性提高且能高速生成波形。语音处理装置具有:存储部,存储对相移后的脉冲信号进行频带分割得到的相移频带脉冲信号;延迟时间算出部,根据从各时刻的语音帧的相位谱算出的群延迟谱的预定频率范围中的频带群延迟参数算出相移频带脉冲信号的延迟时间;相位算出部,根据频带群延迟参数及从频带群延迟参数生成的对相位信息进行修正的频带群延迟修正参数算出边界频率的相位;选择部,基于所算出的各频带的相位从存储部选择对应的相移频带脉冲信号;叠加部,通过使所选择的相移频带脉冲信号按照延迟时间延迟并叠加,生成相移后的声源信号;及声道滤波部,应用与针对输入语音的各语音帧算出的频谱参数对应的声道滤波器输出语音波形。
本申请是申请号为201580082452.1、申请日为2015年9月16日、发明名称为“语音处理装置、语音处理方法以及语音处理程序”的申请的分案申请。
技术领域
本发明的实施方式涉及语音(声音)处理装置。
背景技术
分析语音波形来提取特征参数的语音分析装置、和/或根据分析获得的特征参数来合成语音的语音合成装置,被广泛地用于文本语音合成技术、语音编码技术以及语音识别技术等语音处理技术。
现有技术文献
专利文献
专利文献1:国际公开第2014/021318号
专利文献2:日本特开2013-164572号公报
非专利文献
非专利文献1:坂野秀樹他、「時間領域平滑化群遅延を用いた短時間位相の効率的表現方法」、電子情報通信学会論文誌D-II Vol.J84-D-II、No.4、pp.621-628
发明内容
发明所要解决的问题
然而,以往存在难以利用于统计模型、在重新构建的相位与分析源波形的相位之间会产生偏离的问题。另外,以往存在当使用群延迟特征量进行波形生成时无法高速地生成波形这一问题。本发明所要解决的问题在于,提供能够使语音波形的再现性提高的语音处理装置、语音处理方法以及存储介质。
用于解决问题的技术方案
实施方式的语音处理装置具有:存储部,其存储对相移后的脉冲信号进行频带分割所得到的相移频带脉冲信号;延迟时间算出部,其根据从各时刻的语音帧的相位谱所算出的群延迟谱的预定频率范围中的频带群延迟参数,算出相移频带脉冲信号的延迟时间;相位算出部,其根据所述频带群延迟参数、及从所述频带群延迟参数所生成的对相位信息进行修正的频带群延迟修正参数,算出边界频率的相位;选择部,其基于所算出的各频带的相位,从所述存储部选择对应的相移频带脉冲信号;叠加部,其通过使所选择的相移频带脉冲信号按照所述延迟时间延迟并叠加,生成相移后的声源信号;以及声道滤波部,其应用与针对输入语音的各语音帧所算出的频谱参数对应的声道滤波器,输出语音波形。
附图说明
图1是表示实施方式涉及的语音分析装置的构成例的框图。
图2是示例提取部所接收的语音波形和基音标记(pitch mark)的图。
图3是表示频谱参数算出部的处理例的图。
图4是表示相位谱算出部的处理例和群延迟谱算出部的处理的图。
图5是表示频率标度(scale)的制作例的图。
图6是示例进行了基于频带群延迟参数的分析所得的结果的图。
图7是示例根据频带群延迟修正参数进行了分析所得的结果的图。
图8是表示语音分析装置所进行的处理的流程图。
图9是表示频带群延迟参数算出步骤的详情的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210403587.5/2.html,转载请声明来源钻瓜专利网。