[发明专利]一种复杂环境下语音特征映射方法有效
申请号: | 201710151497.0 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106782520B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 王志锋;郭天学;左明章;田元;姚璜 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/02;G10L15/14;G10L17/02;G10L17/06 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 魏波<国际申请>=<国际公布>=<进入国 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种复杂环境下语音特征映射方法,首先提取干净环境下的语音信号的特征;然后提取复杂环境下的语音信号的特征;接着利用特征映射方法对复杂环境下的语音信号进行特征映射,使得到的映射特征可近似视为干净环境下的语音信号特征;最后与已经训练完毕的干净环境下的语音信号模型进行模式匹配和识别。本发明利用特征映射函数对复杂环境下的语音信号进行映射,使得到的特征可以近似视为干净环境下的语音信号特征,通过映射函数的作用可使复杂环境下的语音特征的纯净度得到大幅度提升从而提升语音识别的准确度,提高语音识别系统的鲁棒性。 | ||
搜索关键词: | 一种 复杂 环境 语音 特征 映射 方法 | ||
【主权项】:
1.一种复杂环境下语音特征映射方法,其特征在于,包括以下步骤:/n步骤1:提取干净环境下的语音信号的特征;/n步骤1的具体实现包括以下子步骤:/n步骤1.1:对干净环境下得到的语音信号进行预处理,包括预加重、分帧、加窗;/n步骤1.2:将步骤1.1中预处理后的信号提取Mel倒谱系数特征;/n步骤1.3:使用混合高斯模型对步骤1.2中得到的特征建立统计模型,得到干净环境下语音信号的模型Λ;/n步骤2:对复杂环境下的语音进行特征提取;/n步骤2的具体实现包括以下子步骤:/n步骤2.1:对复杂环境下得到的语音信号进行预处理,包括预加重、分帧、加窗;/n步骤2.2:将步骤2.1中预处理后的信号提取Mel倒谱系数特征,记为Y=[y1,y2,...,yi,...,yn],yi表示复杂环境下第i帧的语音特征;/n步骤3:利用特征映射方法对复杂环境下的语音特征进行映射;/n骤3的具体实现包括以下子步骤:/n步骤3.1:将特征的每一帧yi都进行映射,映射形式为:/nxi=A·yi+B,简记为:xi=F(yi);/n其中yi为复杂环境下语音特征的第i帧语音特征,xi为通过特征映射函数后得到的第i帧特征,A为增益矩阵,B为偏移矩阵;/n /nA为d行d列的对角矩阵,B为d行1列的矩阵;d为帧长,在分帧的步骤中设置;/n步骤3.2:根据最大似然函数和已知模型Λ对F进行参数估计:/n /n其中Λ为步骤1.3中训练的干净语音模型;/n步骤3.3:根据当前Ft的参数来构造辅助函数计算新的F的参数:/n /n其中,Ft为当前帧的映射函数,F为新的一帧的映射函数;θ表示语音信号状态序列,X表示语音信号特征,C表示所处高斯分量,m表示混合高斯模型的高斯数,n表示语音信号的帧数;/n /np(Cj|Λ)=ωj/n /n其中,ωj表示第j个高斯的权重,μj和Σj分别为第j个高斯分量的均值和方差,为方便记为:/n /n步骤3.4:由步骤3.3可得到辅助函数为:/n /n对各项展开可得:/n /n其中μj,k,δj,k分别表示F的第k个参数的第j个高斯的均值和标准差,yi,k表示映射前的第i帧语音特征的第k个矢量,ak,bk分别为F中增益矩阵a和偏移矩阵b的第k个参数;/n步骤3.5:对步骤3.4中的展开式分别求F关于ak,bk的偏导数:/n /n /n将以上两式展开可得:/n /n /n步骤3.6:为方便计算,分别将以下统计量替代步骤3.5中的统计量:/n /n /n /n /n /n则步骤3.5中的方程式可写为:/n /n /n解上述方程组得:/n /n /n步骤3.7:将解得的A,B代入步骤3.1中即可求得经过映射后的语音信号特征X,视为干净环境下的语音特征;/n步骤4:模式匹配与识别。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710151497.0/,转载请声明来源钻瓜专利网。
- 上一篇:基于置信度的语音识别实现方法及系统
- 下一篇:一种语音识别系统