[发明专利]一种基于时延神经网络的声控设备唤醒词识别方法及装置在审
申请号: | 201910884254.7 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110767231A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 刘博卿;王健宗;贾雪丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/06;G10L15/02 |
代理公司: | 44385 深圳市世联合知识产权代理有限公司 | 代理人: | 刘畅 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 声控设备 词识别 时延神经网络 用户体验 语音数据 多维 后验概率 神经网络 输出识别 特征提取 传统的 数据量 准确率 预设 送入 失败 | ||
1.一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,包括:
对待识别的语音数据进行多维Fbank特征提取;
将提取到的所述多维Fbank特征送入预先训练好的唤醒词识别模型中进行识别,并输出识别结果;
判断所述识别结果中的唤醒词的后验概率是否大于预设阈值,若是,则确认所述待识别的语音数据中包括唤醒词;
其中,所述唤醒词识别模型由作为第一层的音素-时延神经网络与作为第二层词-时延神经网络相连接后经训练得到。
2.根据权利要求1所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,
所述唤醒词识别模型由作为第一层的音素-时延神经网络的输出层与作为第二层词-时延神经网络输入层相连接后经训练得到。
3.根据权利要求2所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,所述唤醒词识别模型由作为第一层的音素-时延神经网络与作为第二层词-时延神经网络相连接后经训练得到,还包括:
从标记有唤醒词的样本语音提取多维Fbank特征;
将提取到的所述多维Fbank特征输入所述所述唤醒词识别模型中进行训练;
达到预设的epoch迭代轮数时停止训练。
4.根据权利要求1所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,所述对所述待识别的语音数据进行多维Fbank特征提取,还包括:
对所述待识别的语音数据进行分帧处理,每帧的帧长范围为10ms~40ms,帧与帧之间的帧移为0ms~20ms,共提取40~100帧语音信号;
对每一帧的所述语音信号进行多维Fbank特征提取。
5.根据权利要求4所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,所述对所述待识别的语音数据进行分帧处理,每帧的帧长范围为10ms~40ms,帧与帧之间的帧移为0ms~20ms,共提取40~100帧语音信号,还包括:
对所述40~100帧语音信号进行跳帧处理,从起始帧开始,忽略每间隔的1-5帧,对忽略后的剩余所述帧的所述语音信号进行多维Fbank特征提取。
6.根据权利要求5所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,
对所述待识别的语音数据进行分帧处理,每帧的帧长范围为25ms,帧与帧之间的帧移为10ms,共提取80帧语音信号,对所述80帧语音信号进行跳帧处理,从起始帧开始,忽略每间隔的4帧,对忽略后的剩余所述帧的所述语音信号进行41维Fbank特征提取。
7.根据权利要求4或5所述的一种基于时延神经网络的声控设备唤醒词识别方法,其特征在于,所述输出识别结果之后,还包括:
所述输出识别结果包括每一帧的所述语音信号中的唤醒词的后验概率序列和非唤醒词的后验概率序列,通过移动平均滤波器对所述识别结果中的唤醒词的后验概率进行平滑处理,计算公式如下所示:
其中,N为对所述待识别的语音数据进行分帧处理后提取的语音信号的帧数,输入值x为每一帧的所述语音信号中的唤醒词的后验概率序列,输出值y为所述识别结果中的唤醒词的后验概率。
8.一种基于时延神经网络的声控设备唤醒词识别装置,其特征在于,包括:
提取模块,用于对待识别的语音数据进行多维Fbank特征提取;
识别模块,用于将提取到的所述多维Fbank特征送入预先训练好的唤醒词识别模型中进行识别,并输出识别结果;
判断模块,判断所述识别结果中的唤醒词的后验概率是否大于预设阈值,若是,则确认所述待识别的语音数据中包括唤醒词;
其中,所述唤醒词识别模型由作为第一层的音素-时延神经网络与作为第二层词-时延神经网络相连接后经训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910884254.7/1.html,转载请声明来源钻瓜专利网。