[发明专利]一种声纹身份认证装置及其认证优化方法和系统在审
申请号: | 201710692088.1 | 申请日: | 2017-08-14 |
公开(公告)号: | CN107481736A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 王炜婷;温坤华;朱慧广;陈俊 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L17/00;G10L17/04 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 身份 认证 装置 及其 优化 方法 系统 | ||
1.一种声纹身份认证装置的认证优化方法,其特征在于,包括:
提取各个注册语音信号对应的梅尔倒谱系数,并对输入的各个所述注册语音信号进行预设编号绑定;
将各个所述注册语音信号对应的梅尔倒谱系数作为输入层,同时将各个所述注册语音信号绑定的编号作为输出层,进行区分深度置信网络训练,并获得所述区分深度置信网络的参数空间;
将各个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得所述区分深度置信网络的隐层输出,并将其作为各个所述注册语音信号对应的梅尔倒谱系数的特征向量;
将各所述特征向量作为输入,并以最大期望算法为准构建高斯混合模型;
将任意一个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得区分深度置信网络的多个隐层输出,并选择其中若干个区分度高于预设阈值的隐层输出作为训练数据,对所述高斯混合模型进行更新。
2.根据权利要求1所述的认证优化方法,其特征在于,对所述高斯混合模型进行更新之后,还包括:
采集待验证语音信号,并对所述待验证语音信号进行身份认证,若通过认证,则进行开锁操作,反之则保持锁定状态。
3.根据权利要求2所述的认证优化方法,其特征在于,对所述待验证语音信号进行身份认证,具体包括:
提取待验证语音信号对应的梅尔倒谱系数;
将所述验证语音信号对应的梅尔倒谱系数作为输入层输入所述区分深度置信网络,以获得其隐层输出,并将所述隐层输出作为所述验证语音信号对应的梅尔倒谱系数的特征向量;
将所述特征向量与所述高斯混合模型进行对比,并计算所述特征向量分别与各个注册语音信号相匹配的后验概率;
判断各所述后验概率中的最大值是否大于预设阈值,如果是,则待验证语音信号通过验证,反之则未通过验证。
4.根据权利要求3所述的认证优化方法,其特征在于,提取待验证语音信号或各个注册语音信号对应的梅尔倒谱系数,具体包括:对待验证语音信号或各个注册语音信号依次进行预加重、加汉明窗、通过维纳滤波法进行去噪、进行快速傅里叶变换、通过三角带通滤波器进行滤波和离散余弦转换。
5.根据权利要求4所述的认证优化方法,其特征在于,在将各个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得所述区分深度置信网络的隐层输出后,还包括:
通过公式:
校核所述区分深度置信网络的隐层输出质量,若D的值大于预设阈值,则隐层输出质量满足预设要求;
其中,D为区分度,Li为各注册语音信号对应的特征向量的对应权值,Si为矩阵S中的元素,S=Sb-Sw,Sb为类内离散度矩阵,Sw为类间离散度矩阵。
6.根据权利要求5所述的认证优化方法,其特征在于,在采集待验证语音信号之前,对所述高斯混合模型进行更新之后,还包括:
采集若干个未训练的注音信号;
若当前未训练的语音信号的数量小于预设阈值,则将各未训练的语音信号所对应的梅尔倒谱系数输入所述区分深度置信网络,以修正其参数空间;
若当前未训练的语音信号的数量超过预设阈值,则将各未训练的语音信号所对应的梅尔倒谱系数输入已修正后的区分深度置信网络,以获取对应的修正特征向量,并利用所述修正特征向量对所述高斯混合模型进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710692088.1/1.html,转载请声明来源钻瓜专利网。