[发明专利]一种语音识别方法、设备及计算机可读存储介质有效
申请号: | 201910014557.3 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109545226B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 贾雪丽;程宁;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/14;G10L15/10;G10L15/06;G10L25/24 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 设备 计算机 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
获取待检测的第一数字语音信号,其中,所述第一数字语音信号是由数字密码组成的,所述数字密码由多个数字组成;
利用HMM分割方法对所述第一数字语音信号进行预设分割处理,得到多个第二数字语音信号,并记录每个所述第二数字语音信号在第一数字语音信号中排列的先后顺序;其中,每个第二数字语音信号均由一个数字确定;
根据预设的信号处理方法对每个所述第二数字语音信号进行处理,确定出与每个所述第二数字语音信号对应的对数梅尔功率频谱,并对每个所述第二数字语音信号对应的对数梅尔功率频谱进行归一化处理,以从所述对数梅尔功率频谱中提取每个所述第二数字语音信号的目标特征信息;
基于神经网络模型对每个所述第二数字语音信号的目标特征信息进行识别,得到与每个所述第二数字语音信号对应的目标数字;
根据每个所述第二数字语音信号对应的目标数字以及记录的每个所述第二数字语音信号在第一数字语音信号中排列的先后顺序,确定所述目标数字排列的先后顺序,并根据所述目标数字排列的先后顺序,确定与所述第一数字语音信号对应的目标数字密码;
获取与目标样本数字语音信号的目标特征信息对应的目标数字的数量,以及获取所述待检测的第一数字语音信号对应的数字的数量;所述目标样本数字语音信号为训练样本集的各样本数字语音信号的目标特征信息中与所述第二数字语音信号的目标特征信息之间的相似度大于预设相似度阈值且相似度最大的样本数字语音信号;
计算所述目标数字的数量与所述第一数字语音信号对应的数字的数量之间的数量比值;根据所述数量比值,确定所述待检测的第一数字语音信号被检测成功的概率,并判断所述概率是否小于预设阈值;
如果判断结果为是,则选取与所述第一数字语音信号相似的样本训练集对所述神经网络模型进行训练调整。
2.根据权利要求1所述的方法,其特征在于,所述获取待检测的第一数字语音信号之前,还包括:
获取训练样本集,所述训练样本集中包括样本数字语音信号的目标特征信息,其中,每个样本数字语音信号均是由一个数字确定的;
根据预设的神经网络算法生成初始神经网络模型;
基于所述训练样本集中的各样本数字语音信号的目标特征信息对所述初始神经网络模型进行训练优化,得到所述神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述基于神经网络模型对每个所述第二数字语音信号的目标特征信息进行识别,得到与每个所述第二数字语音信号对应的目标数字,包括:
计算所述第二数字语音信号的目标特征信息与所述训练样本集中各样本数字语音信号的目标特征信息的相似度;
获取所述相似度大于预设相似度阈值的至少一个样本数字语音信号的目标特征信息;
从所述至少一个样本数字语音信号的目标特征信息中确定出所述相似度最大的目标样本数字语音信号的目标特征信息;
根据预设的样本数字语音信号的目标特征信息与数字之间的对应关系,确定与所述目标样本数字语音信号的目标特征信息对应的目标数字。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的信号处理方法对每个所述第二数字语音信号进行处理,确定出与每个所述第二数字语音信号对应的对数梅尔功率频谱,包括:
对每个所述第二数字语音信号进行分帧加窗处理,得到每个所述第二数字语音信号对应的语音帧;
对每个所述第二数字语音信号对应的语音帧进行快速傅里叶变换,得到每个所述第二数字语音信号对应的语音帧的频谱信号;
将每个所述第二数字语音信号对应的语音帧的频谱信号转换为对数梅尔频谱功率,以得到每个所述第二数字语音信号对应的对数梅尔功率频谱。
5.根据权利要求4所述的方法,其特征在于,所述将每个所述第二数字语音信号对应的语音帧的频谱信号转换为对数梅尔频谱功率,包括:
对每个所述第二数字语音信号对应的语音帧的频谱信号取绝对值,得到每个所述第二数字语音信号对应的语音帧的功率频谱;
将每个所述第二数字语音信号对应的语音帧的功率频谱转换为对数梅尔功率频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910014557.3/1.html,转载请声明来源钻瓜专利网。