[发明专利]一种声纹身份认证装置及其认证优化方法和系统在审
申请号: | 201710692088.1 | 申请日: | 2017-08-14 |
公开(公告)号: | CN107481736A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 王炜婷;温坤华;朱慧广;陈俊 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L17/00;G10L17/04 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种声纹身份认证装置的认证优化方法,包括提取注册语音信号对应的梅尔倒谱系数,并对其进行预设编号绑定;将梅尔倒谱系数作为输入层,将其绑定的编号作为输出层,进行区分深度置信网络训练,并获得其参数空间;将梅尔倒谱系数输入区分深度置信网络,以获得其隐层输出,并将其作为特征向量;将各特征向量作为输入构建高斯混合模型;将任意一个注册语音信号对应的梅尔倒谱系数输入区分深度置信网络,以获得其多个隐层输出,并选择区分度高于预设阈值的隐层输出作为训练数据,对高斯混合模型进行更新。本发明将注册人在后续自然发生变化的语音信号作为训练数据,更新高斯混合模型,使其更加适应于注册人的当前发声状态,保证识别率。 | ||
搜索关键词: | 一种 声纹 身份 认证 装置 及其 优化 方法 系统 | ||
【主权项】:
一种声纹身份认证装置的认证优化方法,其特征在于,包括:提取各个注册语音信号对应的梅尔倒谱系数,并对输入的各个所述注册语音信号进行预设编号绑定;将各个所述注册语音信号对应的梅尔倒谱系数作为输入层,同时将各个所述注册语音信号绑定的编号作为输出层,进行区分深度置信网络训练,并获得所述区分深度置信网络的参数空间;将各个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得所述区分深度置信网络的隐层输出,并将其作为各个所述注册语音信号对应的梅尔倒谱系数的特征向量;将各所述特征向量作为输入,并以最大期望算法为准构建高斯混合模型;将任意一个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得区分深度置信网络的多个隐层输出,并选择其中若干个区分度高于预设阈值的隐层输出作为训练数据,对所述高斯混合模型进行更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710692088.1/,转载请声明来源钻瓜专利网。