[发明专利]语音增强设备和语音记录设备及方法、计算机可读记录介质有效
申请号: | 200710146698.8 | 申请日: | 2007-08-24 |
公开(公告)号: | CN101145346A | 公开(公告)日: | 2008-03-19 |
发明(设计)人: | 松本智佳子 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L11/00;G10L13/02;G10L13/04 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 党晓林 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 设备 记录 方法 计算机 可读 介质 | ||
技术领域
本发明涉及对输入的语音数据的不清楚部分进行校正并输出的语音增强设备、语音记录设备、语音增强程序、语音记录程序、语音增强方法和语音记录方法,更具体地涉及这样的语音增强设备、语音记录设备、语音增强程序、语音记录程序、语音增强方法和语音记录方法,它们可自动地检测并自动地校正与爆破音(例如是否存在爆破音部分,在爆破音部分之后持续的送气音部分的音素长度)有关的缺陷部分,或者与摩擦音的幅度变化有关的缺陷部分。
背景技术
可以容易地复制包括含有人声的记录语音的语音数据。为此,语音数据通常可多次重新使用。尤其是,因为例如在互联网上播客(podcasting)期间可以容易地重新分发包括数字记录语音的语音数据,所以语音数据可以被频繁地重新使用。
但是,人声并不总是清楚地发出。例如,在人声中,爆破音或摩擦音的音量比所包括的其它音节或唇音更高,因而极其难以听到人声。另外,因为可容易地复制并重新分发语音数据,所以由于向下采样以及重复地进行编码和解码而使得辅音部分变得不清楚。由于辅音部分变得不清楚,而使得非常难以听到再现的语音数据。
但是,即使语音数据中的辅音部分不清楚或者语音数据包括唇音,由于重新记录需要进一步的人工,所以语音数据还是以记录语音原样分发。另外,即使由于向下采样或者重复地编码和解码而使得辅音部分变得不清楚,用户也必须容忍例如由于复制导致的声音质量变差的缺陷。
为了再现易于听到的语音数据,提出了各种技术来自动地检测并自动地校正所记录的语音数据的缺陷部分。例如,在用于增强语音中的辅音部分的清晰度的技术中,使用低通滤波器去除语音中包含的噪音频率分量,因而使得语音频带易于听到。
在日本专利申请特开平8-275087号公报中公开的、作为增强辅音部分的方法的辅音增强方法中,通过对倒谱中的控制函数求卷积以缩短倒谱基音从而增强由倒谱基音检测出的辅音部分。
基于音位数据,在日本专利申请特开2004-4952号公报中公开的语音合成器对辅音部分进行频带增强,或者对辅音或辅音及后续元音的延留音进行幅度增强处理。另外,在日本专利申请特开2003-345373号公报中公开的语音合成器包括滤波器,该滤波器使用表示清辅音特性的频谱特性作为传递函数。该语音合成器对音素的频谱分布进行滤波处理以增强频谱分布的特性。
但是,由于与爆破音有关的缺陷(例如,是否存在爆破音部分,在爆破音部分之后持续的送气音部分的音素长度)或者与摩擦音的幅度变化有关的缺陷,辅音或清元音可能包括语音清晰度较低的声音或不悦耳的声音。为此,尽管以专利文献1至3为代表的传统技术可用于检测并校正辅音或清元音,但是该传统技术不能用于进一步划分音素以检测并校正与爆破音有关的缺陷部分或者与摩擦音的幅度变化有关的缺陷部分。另外,如果原始语音自身包括缺陷,那么仅增强原始语音的辅音部分也会增强所述缺陷部分,从而更难以听到语音。
本发明的目的是更容易地解决上述缺陷,并提供这样的语音增强设备、语音记录设备、语音增强程序、语音记录程序、语音增强方法和语音记录方法,它们可自动地检测并自动地校正再现语音中的与爆破音(例如是否存在爆破音部分,在爆破音部分之后持续的送气音部分的音素长度)有关的缺陷部分,或者与摩擦音的幅度变化有关的缺陷部分。
发明内容
本发明的目的是至少部分解决传统技术中的问题。
根据本发明的一个方面,对输入的语音数据的不清楚部分进行校正并输出的语音增强设备包括:波形特征量计算单元,该波形特征量计算单元对于各音素计算语音数据的波形特征量,所述语音数据连同将该语音数据划分为音素的音素边界数据一起被输入;校正确定单元,该校正确定单元基于由所述波形特征量计算单元计算的波形特征量,对于各音素确定语音数据校正的必要性;以及波形校正单元,该波形校正单元通过使用预先存储在音素式波形数据(phonemewise-waveform-data)存储单元中的波形数据,对于各音素对由所述校正确定单元确定有校正必要的语音数据进行校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710146698.8/2.html,转载请声明来源钻瓜专利网。