[发明专利]自动分割单字语音信号的装置与方法无效
申请号: | 200810232545.X | 申请日: | 2008-12-02 |
公开(公告)号: | CN101419796A | 公开(公告)日: | 2009-04-29 |
发明(设计)人: | 陈淮琰;韩召宁;杨亚冬 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04 |
代理公司: | 西安智邦专利商标代理有限公司 | 代理人: | 商宇科 |
地址: | 710075陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 分割 单字 语音 信号 装置 方法 | ||
技术领域
本发明涉及一种分割单字语音信号的装置与方法,尤其是一种自动分割单字语音信号的装置与方法。
背景技术
在语言学习过程中,常会借助许多语言学习工具,如电子辞典等,用来增加学习效果与加快学习速度。目前一般的电子辞典都具有发音的功能,也就是说当使用者通过电子辞典查询单字或例句后,可通过发音的功能,而听取正确的单字或例句的发音。如此,将可大幅提升使用者在语言学习上,在听与说方面的能力。因此,有越来越多的厂商日益重视电子辞典的发音功能。
近来电子辞典标榜具有真人发音的功能,已成为各厂商所诉求的特色。而真人发音可通过真人来录制各个单字的声波,而达到真人发音的功能。然而,利用真人来录制所有单字的声波,将耗费掉电子辞典内存非常多的储存空间,进而提升成本的支出。
因此,发展出通过发音合成的方式,而达到接近真人发音的功能,如此可节省内存的空间,也同时提高发音的质量。发音合成的方式一般可分为两种,以英文单字为例说明如下。
第一种方式,依照英文辞典单字表中的音标来决定音节。在合成一个英文单字的语音数据前,必须先将此英文单字分割为单个或多个音节,再由原始录音的数据中获取出与音节相对应的声波,并加以结合即可。
第二种方式,录制所有各种声母、韵母及音调组合的各个音节声波,并储存在内存中。在合成一个英文单字的语音数据前,必须先将此英文单字分割为单个或多个音节,再由录制的数据中获取出与分割后的各个音节相对应的声波,并加以结合即可。
由上述说明可知,不论是哪种发音合成的方式,都必须先将英文单字分割为单个或多个音节,才能进行后续的处理。而传统的作法上,是通过人耳听音而利用手工切分。如此,需投入大量的人力与工时才能完成。另外,手工切分音节的工作枯燥、数量庞大,且采用人耳听音而作音节的切分,极易产生误差。
因此,如何解决传统上人工切分单字语音所衍生的问题,为亟待解决的议题。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种自动分割单字语音信号的装置与方法。
本发明的技术解决方案是:本发明为一种自动分割单字语音信号的装置,其特殊之处在于:该装置包括:接收模块,用来接收单字语音信号,并将单字语音信号划分为多个音框;分析模块,分析音框,产生对应于每一个音框的语音特征;分割模块,根据语音特征,分割单字语音信号为音节,接收模块接入分析模块,分析模块接入分割模块。
上述语音特征包含音框的平均振幅值。
上述语音特征包含音框的平均过零率。
上述语音特征包含音框的倒频谱参数。
上述分析模块根据语音特征产生门坎值,通过分割模块对比语音特征与门坎值。
一种实现上述自动分割单字语音信号装置的方法,其特殊之处在于:该方法包含下列步骤:
1)接收单字语音信号;
2)划分单字语音信号为多个音框;
3)分析音框,产生对应于每一个音框的语音特征;
4)根据语音特征,分割单字语音信号为音节。
上述语音特征包含音框的平均振幅值。
上述语音特征包含音框的平均过零率。
上述语音特征包含音框的倒频谱参数。
上述步骤4)的具体步骤如下:
4.1)根据语音特征产生门坎值,
4.2)通过对比语音特征与门坎值,找出语音信号中的每一个音节的分割点;
4.3根据分割点,将单字语音信号分割为音节。
本发明提供的自动分割单字语音信号的装置与方法,通过语音特征来自动分割单字语音信号为音节,完全替代了传统的人工切分单字语音的方式,整个过程不需要人工介入,省时省力,效率高,且大大降低了人为带来的失误率。
附图说明
图1为自动分割单字语音信号的装置示意图;
图2为多音节单字语音信号的示意图;
图3为多音节单字语音信号的分割示意图;
图4为自动分割单字语音信号的方法流程图。
其中,10-接收模块,20-分析模块,30-分割模块;
具体实施方式
参见图1,自动分割单字语音信号的装置包含:接收模块10、分析模块20及分割模块30。
接收模块10接收单字语音信号,并将单字语音信号划分为多个音框。分析模块20分析多个音框,并产生对应于每一个音框的语音特征。分割模块30根据分析模块20所分析出的语音特征,进而分割单字语音信号为音节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810232545.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:本式电子证件阅读机射频装置
- 下一篇:一种轧辊管理系统及其方法