[发明专利]语音处理装置在审
申请号: | 202210403587.5 | 申请日: | 2015-09-16 |
公开(公告)号: | CN114694632A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 田村正统;森田真弘 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/06;G10L25/18 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 万利军;段承恩 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 装置 | ||
1.一种语音处理装置,具有:
存储部,其存储对相移后的脉冲信号进行频带分割所得到的相移频带脉冲信号;
延迟时间算出部,其根据从各时刻的语音帧的相位谱所算出的群延迟谱的预定频率范围中的频带群延迟参数,算出相移频带脉冲信号的延迟时间;
相位算出部,其根据所述频带群延迟参数、及从所述频带群延迟参数所生成的对相位信息进行修正的频带群延迟修正参数,算出边界频率的相位;
选择部,其基于所算出的各频带的相位,从所述存储部选择对应的相移频带脉冲信号;
叠加部,其通过使所选择的相移频带脉冲信号按照所述延迟时间延迟并叠加,生成相移后的声源信号;以及
声道滤波部,其应用与针对输入语音的各语音帧所算出的频谱参数对应的声道滤波器,输出语音波形。
2.根据权利要求1所述的语音处理装置,
所述存储部,
存储相移频带脉冲信号,该相移频带脉冲信号是将相位的主值量化为预定级后的各相位的频带脉冲信号,
所述选择部,
在所述频带群延迟参数的各频率范围中,根据所述频带群延迟参数及所述频带群延迟修正参数算出该频带的开始频率的相位,算出根据所述频带群延迟参数而整数化所得到的延迟量,根据所述延迟量算出群延迟,将根据所述延迟量所算出的群延迟作为倾斜度,算出经过所述开始频率的相位的直线的频率原点处的相位值,选择与所算出的相位值的主值对应的相移频带脉冲信号,
所述叠加部,
叠加根据所述延迟量延迟后的相移频带脉冲信号。
3.根据权利要求1所述的语音处理装置,
还具有频带噪声信号存储部,该频带噪声信号存储部存储进行频带分割所得到的频带噪声信号,
所述声道滤波部,
针对混合声源信号,应用与频谱参数对应的声道滤波器,该混合声源信号是将各频带的噪声信号及所述相移频带脉冲信号混合所得到的信号,该各频带的噪声信号是基于表示预定频率范围的噪声成分的比率的频带噪声强度参数的各频带的强度、根据所述频带噪声信号所生成的信号。
4.一种语音处理装置,具有:
统计模型存储部,其存储统计模型,该统计模型是使用针对输入语音的各语音帧所算出的频谱参数、根据所述各语音帧的相位谱所算出的群延迟谱的预定频率范围中的频带群延迟参数、及对根据所述频带群延迟参数所生成的相位谱进行修正的频带群延迟修正参数进行学习所得到的模型;
参数生成部,其基于与任意的输入文本对应的上下文信息、及所述统计模型存储部所存储的统计模型,生成与输入文本对应的频谱参数、频带群延迟参数及频带群延迟修正参数;以及
波形生成部,其根据所述参数生成部所生成的频谱参数、频带群延迟参数及频带群延迟修正参数,生成波形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210403587.5/1.html,转载请声明来源钻瓜专利网。