[发明专利]一种基于声纹识别的智能锁及其语音识别方法和系统在审
申请号: | 201710692968.9 | 申请日: | 2017-08-14 |
公开(公告)号: | CN107240397A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 王炜婷;温坤华;朱慧广;陈俊 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/14;G07C9/00 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 识别 智能 及其 语音 方法 系统 | ||
1.一种基于声纹识别的智能锁的语音识别方法,其特征在于,包括:
提取待验证语音信号对应的梅尔倒谱系数;
将所述梅尔倒谱系数作为输入层输入具有预设参数空间的区分深度置信网络,以获得所述区分深度置信网络的隐层输出,并将其作为所述梅尔倒谱系数的特征向量;
将所述特征向量与各个注册语音信号预先构建的高斯混合模型进行对比,并计算所述特征向量分别与各个注册语音信号相匹配的后验概率;
判断各所述后验概率中的最大值是否大于预设阈值,如果是,则待验证语音信号通过验证,并对锁具进行开锁操作;反之则使锁具保持锁定状态。
2.根据权利要求1所述的语音识别方法,其特征在于,在提取待验证语音信号对应的梅尔倒谱系数之前,还包括:
对智能锁的注册人进行注册语音录入,并对输入的各个注册语音信号构建高斯混合模型。
3.根据权利要求2所述的语音识别方法,其特征在于,对输入的各个注册语音信号构建高斯混合模型,具体包括:
提取各个注册语音信号对应的梅尔倒谱系数,并对输入的各个所述注册语音信号进行预设编号绑定;
将各个所述注册语音信号对应的梅尔倒谱系数作为输入层,同时将各个所述注册语音信号绑定的编号作为输出层,进行区分深度置信网络训练,并获得所述区分深度置信网络的参数空间;
将各个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得所述区分深度置信网络的隐层输出,并将其作为各个所述注册语音信号对应的梅尔倒谱系数的特征向量;
将各所述特征向量作为输入,并以最大期望算法为准构建高斯混合模型。
4.根据权利要求3所述的语音识别方法,其特征在于,提取待验证语音信号或各个注册语音信号对应的梅尔倒谱系数,具体包括:对待验证语音信号或各个注册语音信号依次进行预加重、加汉明窗、通过维纳滤波法进行去噪、进行快速傅里叶变换、通过三角带通滤波器进行滤波和离散余弦转换。
5.根据权利要求4所述的语音识别方法,其特征在于,在将各个所述注册语音信号对应的梅尔倒谱系数输入所述区分深度置信网络,以获得所述区分深度置信网络的隐层输出后,还包括:
通过公式:
校核所述区分深度置信网络的隐层输出质量,若D的值大于预设阈值,则隐层输出质量满足预设要求;
其中,D为区分度,Li为各注册语音信号对应的特征向量的对应权值,Si为矩阵S中的元素,S=Sb-Sw,Sb为类内离散度矩阵,Sw为类间离散度矩阵。
6.根据权利要求5所述的语音识别方法,其特征在于,在提取待验证语音信号对应的梅尔倒谱系数之前,对智能锁的注册人进行注册语音录入之后,还包括:
采集若干个未训练的语音信号;
若当前未训练的语音信号的数量小于预设阈值,则将各未训练的语音信号所对应的梅尔倒谱系数输入所述区分深度置信网络,以修正其参数空间;
若当前未训练的语音信号的数量超过预设阈值,则将各未训练的语音信号所对应的梅尔倒谱系数输入已修正后的区分深度置信网络,以获取对应的修正特征向量,并利用所述修正特征向量对所述高斯混合模型进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710692968.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音合成方法
- 下一篇:智能语音交互方法及装置