[发明专利]一种语音识别系统及其识别方法无效
申请号: | 201210242311.X | 申请日: | 2012-07-12 |
公开(公告)号: | CN102789779A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 张晶;覃本灼 | 申请(专利权)人: | 广东外语外贸大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/14 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510006 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 系统 及其 方法 | ||
技术领域
本发明涉及语音识别技术领域,特别涉及一种基于android操作系统实现本地的语音识别功能的操作系统。本发明还涉及该语音识别系统的语音识别方法。
背景技术
在嵌入式操作系统中实现语音识别功能,通常需要对输入的语音进行预处理,提取取特征参数,模式匹配,再输出。其中,模式匹配通常采取传统DHMM模型进行模式匹配,张卫清的《语音识别算法的研究》提供了详细的隐马尔科夫模型。隐马尔可夫模型(HMM)可以用五个元素来描述,包括2个状态集合和3个概率矩阵,一般可以用λ=(A,B,π)三元组来简洁的表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态之间的概率关系。而在传统DHMM算法模式匹配过程中,分别对所有模板进行匹配,当模板数量增加时,匹配过程所消耗的时间而随之增加,也即当要识别的语音数量较大时,实时性较差。
发明内容
本发明的目的在于设计能在语音数量较大的情况下,实现实时,且具有较高识别率的语音识别系统。本发明的另外一个目的在于提供该翻译系统的语音识别方法。
为了实现上述发明目的,本发明包括如下技术特征:一种语音识别系统,其包括语音采集模块、语音预处理模块、语音特征提取模块、分组判定模块和语音识别模块,分组判定模块用于对语音进行聚类分组;语音采集模块与语音预处理模块连接,语音预处理模块与语音特征提取模块连接,语音特征提取与分组判定模块连接,分组判定模块与语音识别模块连接;分组判定模块包括分组判断单元和不少于2个的分组模型;语音特征提取模块与分组判断单元连接,分组判断单元分别与不少于2个的分组模型连接;分组模型与语音识别模块连接。
所述语音预处理模块包括依次连接的预加重单元、分帧处理单元、窗化处理单元和端点检测单元;预加重单元与语音采集模块连接,端点检测单元与语音特征提取模块连接。
本发明还包括一种语音识别系统的语音识别方法,其包括以下步骤:
(1)对输入的语音进行预加重、分帧、加窗、端点检测的预处理;
(2)提取MFCC语音特征作为识别特征,生成语音特征参数;
(3)计算输入语音的Co向量,通过Co向量与每个分组对应的特征参数的欧氏距离,判定其所属类别;
(4)与输入语音所属类别中的全部语音,通过传统DHMM模型进行模式匹配。DHMM这个模型可以根据输入语音的特征参数直接得出匹配结果。它的判定方法是:所有输入DHMM模型的语音中,输出的概率最大的语音便为匹配结果。
所述步骤(3)包括:
A、设语音Wn的MFCC特征参数为Nn×Mm的矩阵,将所有行都拼接到第一行后面,使Wn的MFCC特征参数用一个Nn×Mm维的行向量Co表征;
B、对全部语音对应的Co向量组多次使用K-means算法进行聚类,记下每个语音,每次聚类所属类别号,用一个行向量Vn来表示;
C、计算每个语音对应行向量Vn的均值En,方差σn,用En与σn的乘积Pn来表征每个语音;
D、对由Pn组成的向量使用K-means算法进行聚类,得出每个类别所包含的语音;
E、对每个类别中所有语音对应的Co向量求平均值Fe,Fe为分组特征参数。
MFCC特征参数,Co向量,乘积Pn,都是用来表征一个语音的,只是乘积Pn为一个值,较前面两个而言,维度低,数据量小。
向量Vn及其均值En,方差σn,是一些中间参数,目的是求出乘积Pn。而通过Pn便可得出聚类结果。
分组特征参数Fe,是用来表征一个类别的。在识别阶段就是利用它来进行类别的判断的。
该过程中出现了两次K-means算法,第一次是为了进行聚类分析,求出乘积Pn来表征一个语音。第二次才是求聚类结果。
本发明为一种android操作系统上实现本地的语音识别功能的操作系统,通过对采集到的声音信号进行预先处理,使得系统在后期语音识别时效率更高,识别准确率也更高。通过聚类算法将具有相近声学特征的语音聚为同一组,在对输入语音进行识别前,先判断其所属分组,然后仅在该分组内对输入语音进行模式匹配的计算。通过增加冗余语音来提高识别准确率,添加冗余后,分组模型库小,识别过程开销也小,大大提高了实时性和识别精度。
附图说明
图1为本发明的模块原理图;
图2为本发明的流程图;
图3为本发明的Co向量生成图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学,未经广东外语外贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210242311.X/2.html,转载请声明来源钻瓜专利网。