[发明专利]一种沪语语音识别信息处理方法有效
申请号: | 201010583367.2 | 申请日: | 2010-12-10 |
公开(公告)号: | CN102543073A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 陈开;许华虎;阳诚海;施建刚;孙弘刚 | 申请(专利权)人: | 上海上大海润信息系统有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200072 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 信息处理 方法 | ||
技术领域
本发明涉及一种语音识别方法,尤其是涉及一种沪语语音识别信息处理方法。
背景技术
在语音识别方面最早进行的是说话人的识别,主要集中在单纯的人耳听辨,真正的语音识别是研究采用语音信号线性预测编码技术和动态时间规整技术,主要是对于孤立字,采用的是模板匹配的技术。我国从1987年开始才对普通话进行语音识别方面的研究,然后对于方言口音,方言的识别发展相对滞后。沪语在音系结构,韵律特征,语言语法方面都不同于普通话。不能简单借用识别普通话的方法来识别沪语。而且普通话的识别模型采用了经典的HMM,该方法会导致时空复杂度高的问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种识别速度高的沪语语音识别信息处理方法。
本发明的目的可以通过以下技术方案来实现:
一种沪语语音识别信息处理方法,其特征在于,包括以下步骤:
1)声音输入设备输入沪语信号;
2)预处理模块对输入的沪语语音信号进行预处理;
3)特征提取模块提取出反映信号特征的特征参数;
4)训练模块将用户输入若干次训练语音信号,经过预处理和特征参数提取后得到特征矢量参数,然后通过特征建模模块建立训练语音的参考模型库,或对模型库中的参考模型作适应性修正;
5)识别模块将输入语音的特征矢量参数和参考模型库中的模型进行相似度进行比较,将相似度最高的模型的输入作为识别候选结果输出;
6)后处理模块对步骤5)中的识别候选结构通过语音知识处理得到最终的识别结果;
7)最终的识别结果通过声音输出设备输出。
所述的步骤2)中的预处理包括对含噪语音信号进行端点检测,语音分帧以及预加重处理。
所述的步骤3)中的提取出反映信号特征的特征参数步骤如下:
1)选取基音周期、共振峰和基于听觉特性的Mel频率倒谱系数作为特征参数;
2)对语音信号进行低通滤波后,以设定取样频率进行采样,最后以设定的滞后时间逐帧计算短时相关系数,得到基音周期;
3)直接对语音信号求离散傅里叶变换,用DFT谱来提取语音信号的共振峰参数;
4)用M个Mel带通滤波器进行滤波,将每个滤波器的输出取对数,得到相应频带的对数功率谱,并进行反离散余弦变换,得到L维Mel频率倒谱系数,取前12维Mel频率倒谱系数。
所述的步骤4)中的参考模型为GMM和半连续HMM模型,该模型包括沪语语音的训练数据库和由数据库生成的码本,结合码本和训练数据库,来计算声学模型的混合加权值,最后生成GMM和半连续HMM模型。
所述的步骤6)中的语音知识处理包括语言模型、词法、句法处理。
与现有技术相比,本发明具有基于多通道的GMM和半连续HMM的沪语声学模型,该模型一定程度上解决了HMM模型时空复杂度高,复杂性等问题,基于多通道更加精确了各个附加权值的估计,提高了识别速度。
附图说明
图1为本发明的流程图;
图2为本发明的硬件结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所示,一种沪语语音识别信息处理方法,其特征在于,包括以下步骤:
步骤101、声音输入设备1输入沪语信号;
步骤102、预处理模块21对输入的沪语语音信号进行预处理,其主要对含噪语音信号进行端点检测,语音分帧以及预加重处理;
步骤103、特征提取模块22选取基音周期、共振峰和基于听觉特性的Mel频率倒谱系数作为特征参数,基音周期含有丰富的音调信息,共振峰和基于听觉特性的Mel频率倒谱系数在本质上反映了语音音色,是最为重要的特征参数;
步骤104、由于语音信号的基音频率一般都在500Hz以下,即使女高音C调最高也不超过1KHz,特征提取模块22用一个带宽为1KHz的低通滤波器对语音信号滤波,然后以2KHz取样频率进行采样,最后以10ms的滞后时间逐帧计算短时相关系数,每帧长度为20ms。,得到基音周期;
步骤105、特征提取模块22直接对语音信号求离散傅里叶变换,用DFT谱来提取语音信号的共振峰参数,但是直接DFT的谱要受基频谐波的影响,最大值只能出现在谐波频率上,因而共振峰测定误差较大。为了消除基频谐波的影响,可以采用同态解卷技术,经过同态滤波后得到平滑的谱,这样简单地检测峰值就可以直接提取共振峰参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上大海润信息系统有限公司,未经上海上大海润信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010583367.2/2.html,转载请声明来源钻瓜专利网。