[发明专利]一种基于自适应并行模型组合的鲁棒语音身份识别方法在审
申请号: | 201810035573.6 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108257606A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 葛洪伟;李聪;葛阳 | 申请(专利权)人: | 江南大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/20;G10L17/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自适应并行模型组合的鲁棒语音身份识别方法,主要解决噪声环境下由于真实测试环境与训练环境之间的差异而导致的说话人身份识别性能急剧下降的问题,该方法通过从实际测试环境的语音中估计噪声信息,并将该信息通过相应变换后对纯净训练GMM模型参数进行补偿,使调整后的GMM参数能够尽量匹配当前测试环境,进而提高整个语音说话人身份识别的鲁棒性。本发明方法能够提高噪声环境下语音身份识别系统的识别率,提高系统的鲁棒性和自适应的能力,满足日常生活中如智能家居、车载系统和各种需要进行身份安全认证的安全领域。 | ||
搜索关键词: | 语音身份识别 测试环境 自适应 并行模型 身份识别 噪声环境 鲁棒性 鲁棒 语音 身份安全认证 安全领域 车载系统 模型参数 信息通过 训练环境 噪声信息 智能家居 识别率 匹配 | ||
【主权项】:
1.一种基于自适应并行模型组合的鲁棒语音身份识别方法,其特征在于:首先对语音进行预处理操作,并提取语音特征,经过自适应的噪声估计得出倒谱域噪声参数,包括均值向量和协方差矩阵,然后对纯净语音倒谱特征训练成的GMM参数同噪声参数经倒谱提升逆变换和离散余弦反变换一同变换到对数谱域,接着通过指数变换变换到线性谱域,在线性谱域,对原始GMM模型参数和噪声参数进行加性合并,再经过对数变换将参数变换到对数谱域,进而再通过离散余弦变换和倒谱系数提升变换到倒谱域,得到补偿后的GMM模型参数,最后通过最大似然估计得到识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810035573.6/,转载请声明来源钻瓜专利网。
- 上一篇:多通道录音方法、装置及电子设备
- 下一篇:音频内容修正的方法及其智能装置