[发明专利]语音处理设备及方法有效
申请号: | 201410213321.X | 申请日: | 2014-05-20 |
公开(公告)号: | CN104240696B | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 外川太郎;盐田千里;大谷猛 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L25/87 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 元音 语音处理设备 输入语音 配置 计算机处理器 估计单元 获取单元 语音处理 检测 | ||
1.一种语音处理设备,包括计算机处理器,所述设备包括:
获取单元,其获得输入语音;
检测单元,其检测包含在所述输入语音中的元音段;
重音段估计单元,其估计包含在所述输入语音中的重音段,所述重音段估计单元估计具有所述输入语音的功率的变化率的强烈减小趋势的段是所述重音段;
元音段长度指定单元,其指定包含所述重音段的第一元音段长度以及不包含所述重音段的第二元音段长度;以及
控制单元,其控制所述第一元音段长度和所述第二元音段长度中的至少一个,使得所述第一元音段长度变得长于所述第二元音段长度。
2.根据权利要求1所述的设备,
其中,所述控制单元延长所述第一元音段长度或者缩短所述第二元音段长度。
3.根据权利要求1所述的设备,
其中,所述控制单元基于所述第一元音段长度与所述第二元音段长度之间的比值或差值来控制所述第一元音段长度或所述第二元音段长度。
4.根据权利要求1所述的设备,还包括:
特征计算单元,其被配置成计算所述元音段的基本周期,
其中,所述控制单元以所述基本周期为单位来控制所述第一元音段长度或所述第二元音段长度。
5.根据权利要求4所述的设备,
其中,所述特征计算单元还计算声学特征的量,所述声学特征包括所述元音段的基音频率、共振峰频率及自相关中的至少一个,并且
其中,当确定所述元音段是这样的段时:即对于该段,每单位时间内所述声学特征的量的变化量小于预定的第一阈值,所述控制单元控制所述第一元音段长度或所述第二元音段长度。
6.根据权利要求1所述的设备,
其中,当确定所述元音段是如下的段时,所述控制单元控制所述第一元音段长度或所述第二元音段长度:对于该段,针对所述第一元音段长度或所述第二元音段长度的自相关值等于或大于预定的阈值,或者对于该段,幅值小于预定的阈值。
7.根据权利要求1所述的设备,
其中,所述控制单元通过添加如下信号来延长或缩短所述第一元音段长度或所述第二元音段长度:其中随着时间减小的加权因子被施加到要被控制的目标帧之前的帧的信号,以及其中随着时间增大的加权因子被施加到所述目标帧之后的帧的信号。
8.根据权利要求1所述的设备,还包括:
识别单元,其被配置成将所述输入语音识别为文本信息,
其中,所述识别单元基于所述文本信息来识别所述第一元音段长度或所述第二元音段长度。
9.一种语音处理方法,包括:
获得输入语音;
检测包含在所述输入语音中的元音段;
估计包含在所述输入语音中的重音段,其中,估计具有所述输入语音的功率的变化率的强烈减小趋势的段是所述重音段;
指定包含所述重音段的第一元音段长度以及不包含所述重音段的第二元音段长度;以及
控制所述第一元音段长度和所述第二元音段长度中的至少一个,使得所述第一元音段长度变得长于所述第二元音段长度。
10.根据权利要求9所述的方法,
其中,所述控制包括延长所述第一元音段长度或者缩短所述第二元音段长度。
11.根据权利要求9所述的方法,
其中,所述控制包括基于所述第一元音段长度与所述第二元音段长度之间的比值或差值来控制所述第一元音段长度或所述第二元音段长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410213321.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全小米粉窝头及其生产方法
- 下一篇:一种调节脾胃虚寒的炭香米及其制备方法