[发明专利]一种黏着语语音识别方法及系统有效
申请号: | 201210551676.0 | 申请日: | 2012-12-18 |
公开(公告)号: | CN103021407A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 颜永红;徐及;潘接林 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 黏着 语音 识别 方法 系统 | ||
技术领域
本发明涉及语音识别领域,尤其涉及一种黏着语语音识别方法及系统。
背景技术
黏着语,主要依靠词尾的变化来表现其文法关系,其典型特征是语言中的词级单元是由大量词素连接而构成的。相较于隶属于分析语的汉语,黏着特性给语音识别带来许多新的挑战,使其在传统语音识别框架下的性能受到大幅影响。在这些新的挑战中,比较重要的可以归纳为以下两点:第一个是在语言模型建模方面,韩语自然语言单元字和词等由空格分隔的语言单元均不适宜作为语言模型建模单元;第二个是在声学模型建模方面,黏着特性导致的严重协同发音使声学模型的混淆度大幅提升。
在以上两个挑战中,第一个挑战在近年来已得到较为广泛的研究,很多研究者使用基于统计或规则的方法生成一种介于字和词之间的新单元作为语言模型建模单元,称之为词片。第二个挑战目前仍没有有效解决方案,有研究者试图在短时特征下通过引入同位音素的概念来削弱声学模型的混淆程度,但实验证明这一方法尽管在基本的单因子建模单元上效果明显,但在常规语音识别系统所使用的三因子建模单元上效果并不理想。
发明内容
针对上述问题,本发明实施例提出一种黏着语语音识别方法、系统。
在第一方面,本发明实施例提出一种黏着语语音识别方法,所述方法包括:提取语音长时特征;对所述长时特征计算扩展音素集后验概率;对所述后验概率进行主成分分析PCA降维处理,得到基于所述长时特征的多层感知MLP特征;将所述MLP特征进行基于高斯混合-隐形马尔可夫模型GMM-HMM框架的语音识别,得到识别结果。
优选地,所述黏着语是韩语或维吾尔语。
优选地,所述长时特征将辅音根据其所在位置分解为同位音素。
优选地,所述扩展音素集包含66个韩语音素,其中首辅音18个,元音21个,尾辅音27个。
在第二方面,本发明实施例提出一种黏着语语音识别系统,所述系统包括:语音长时特征提取模块,用于提取语音长时特征;后验概率计算模块,用于对所述长时特征计算扩展音素集后验概率;多层感知特征获取模块,用于对所述后验概率进行主成分分析PCA降维处理,得到基于所述长时特征的多层感知MLP特征;识别模块,用于将所述MLP特征进行基于高斯混合-隐形马尔可夫模型GMM-HMM框架的语音识别,得到识别结果。
优选地,所述黏着语是韩语或维吾尔语。
优选地,所述长时特征将辅音根据其所在位置分解为同位音素。
优选地,所述扩展音素集包含66个韩语音素,其中首辅音18个,元音21个,尾辅音27个。
本发明实施例利用长时特征在刻画协同发音方面的优势对韩语音素集进行细化分类,有效降低声学模型的混淆程度,提高了语音识别的效果。
附图说明
图1是本发明实施例黏着语语音识别系统示意图;
图2是本发明实施例的韩语扩展音素集示意图;
图3是本发明实施例的黏着语语音识别方法流程示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例致力于解决黏着语语音识别在声学模型建模中所遇到的问题。所述黏着语包括韩语和维吾尔语。为方便叙述,下面以韩语为例进行说明。通过采取精细化的语音分析方法发掘音素中的差异,对语音识别系统中原本被认为发音一致的韩语音素进行区分,降低声学模型混淆程度,从而改善系统整体性能。
在韩语语音识别系统中,引起声学模型高混淆度的主要原因是协同发音。鉴于人类的协同发音通常影响数百毫秒语音,因此传统语音识别系统通常使用的短时特征(如Mel Freq uency Cepstru m Coefficient,M FCC和PerceptualLinear Prediction,PLP)难以对其进行有效分析。本发明实施例将长时特征应用到韩语语音识别系统,利用长时特征的高区分度对韩语音素集进行细化分类。新扩展音素集在原音素集基础上将辅音根据所在位置分解为同位音素,而元音部分保持不变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210551676.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:超辐射发光二极管及其制作方法
- 下一篇:一种颗粒物PM2.5粒径切割装置