[发明专利]声学模型自适应方法及系统在审
申请号: | 201610156697.0 | 申请日: | 2016-03-18 |
公开(公告)号: | CN105590625A | 公开(公告)日: | 2016-05-18 |
发明(设计)人: | 李轶杰;刘青松;许东星 | 申请(专利权)人: | 上海语知义信息技术有限公司 |
主分类号: | G10L15/07 | 分类号: | G10L15/07 |
代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 曾耀先 |
地址: | 200031 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 模型 自适应 方法 系统 | ||
技术领域
本发明涉及语音识别领域,特指一种声学模型自适应方法及系统。
背景技术
现有被证明效果最好的语音识别系统中,声学模型大多是在成百上千 小时数据集合上训练的深度网络模型。目前训练声学模型所用的声学特征 是与说话人无关的滤波器组(filter-bank,fBank)特征,因此训练出来的声 学模型也是与说话人无关的。利用深度网络模型来进行语音识别,由于该 模型训练时缺少说话人相关的个性特征,而使得语音识别的准确率较低, 且语音识别的适应性较差。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种声学模型自适应方 法及系统,解决现有技术中的深度网络模型因缺少说话人相关的个性特征 而使得语音识别的准确率较低和语音识别的适应性较差的问题。
实现上述目的的技术方案是:
本发明一种声学模型自适应方法,包括:
在声学模型训练集上,对每段语音数据基于深度神经网络模型提取与 说话人相关的身份认证矢量;
在所述声学模型训练集上,对每段语音数据提取声学特征参数;以及
将从所述语音数据中提取的所述身份认证矢量和所述声学特征参数 拼接在一起,并作为深度神经网络模型的输入进行训练以形成声学识别模 型。
本发明利用深度神经网络模型提取对应说话人的身份认证矢量,并利 用身份认证矢量对深度神经网络模型进行重训练,使得深度神经网络模型 具有较好的说话人自适应的特点,提高了语音识别的准确率。
本发明声学模型自适应方法的进一步改进在于,对每段语音数据基于 深度神经网络模型提取与说话人相关的身份认证矢量,包括:
对所述语音数据提取出39维麦尔倒谱系数,并根据计算公式提取所 述身份认证矢量,所述计算公式为:
M[ZF×1]=n[ZF×1]+T[ZF×D]i[D×1](一)
式一中:M为说话人语音的高斯混合模型均值超矢量,n为深度神经 网络模型超矢量,T为总变异空间,i为服从N(0,1)分布的身份认证矢 量,Z为混合高斯模型的混合度或深度神经网络的senones个数,F为麦 尔倒谱系数的维数,F=39维,D为总变异空间的维度;
D的范围在100维至300维之间。
本发明声学模型自适应方法的进一步改进在于,对每段语音数据提取 声学特征参数,包括:
对每段语音数据中的每一语音帧提取90维声学特征参数,所述90 维声学特征参数组成包括:29维滤波器组特征及其一阶二阶差分,1维基 频参数及其一阶二阶差分组成。
本发明声学模型自适应方法的进一步改进在于,将从所述语音数据中 提取的所述身份认证矢量和所述声学特征参数拼接在一起,包括:
将所述语音数据中的当前语音帧和其前后5个语音帧的声学特征参 数拼接在一起以形成990维声学特征参数;
将与所述当前语音帧的语音数据对应的身份认证矢量与990维声学 特征参数拼接在一起。
本发明声学模型自适应方法的进一步改进在于,还包括在语音识别阶 段,依据所述声学识别模型进行语音识别以形成识别结果,包括:
提取待识别语音的身份认证矢量以形成待识别的身份认证矢量;
提取待识别语音中当前语音帧和其前后5个语音帧的声学特征参数 拼接在一起以形成待识别的声学特征参数;
将所述待识别的身份认证矢量和所述待识别的声学特征参数拼接在 一起并输入所述声学识别模型,并经所述声学识别模型进行解码以得到识 别结果。
本发明还提供了一种声学模型自适应系统,包括:
声学模型训练集单元,用于存储不同说话人的语音数据;
身份认证矢量提取单元,与所述声学模型训练集单元连接,用于对所 述声学模型训练集单元中的每段语音数据基于深度神经网络模型提取与 说话人相关的身份认证矢量;
声学特征提取单元,与所述声学模型训练集单元连接,用于对所述声 学模型训练集单元中的每段语音数据提取声学特征参数;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海语知义信息技术有限公司,未经上海语知义信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610156697.0/2.html,转载请声明来源钻瓜专利网。