[发明专利]命令词识别方法、装置、电子设备和存储介质在审
申请号: | 202110791226.8 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113539266A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 王江;蒋华晨;奚少亨 | 申请(专利权)人: | 盛景智能科技(嘉兴)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 314506 浙江省嘉兴市桐乡*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命令 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种命令词识别方法、装置、电子设备和存储介质,所述方法包括:提取待激活语音指令的声学特征;对声学特征进行解码,得到待激活语音指令的解码结果;解码结果包括待激活语音指令中候选命令词的得分和候选命令词的音节参数;基于待激活语音指令的信噪比,以及候选命令词的音节参数,确定候选命令词的激活阈值;若得分小于激活阈值,则确定候选命令词为待激活语音指令的命令词。本发明的激活阈值能够根据不同场景和不同音节参数动态调整,避免不同场景下携带的噪声以及不同音节参数影响命令词的识别,提高了命令词的召回率,同时避免使用复杂算法识别命令词,降低了计算难度,提高了识别效率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种命令词识别方法、装置、电子设备和存储介质。
背景技术
在传统的语音交互场景中,人们通过键盘、鼠标、触摸屏、按钮的方式实现人机交互,而语音作为人机交互最自然的方法,随着AI技术的进一步发展,语音命令词交互技术得到了广泛的应用。
目前语音命令词识别的交互方式主要有三种:一是通过按键触发命令词检出方法;二是通过语音唤醒触发命令词检出方法;三是非触发式命令词检出方法。然而,上述方法命令词的召回率较低,无法适用于不同的工业制造场景。
发明内容
本发明提供一种命令词识别方法、装置、电子设备和存储介质,用以解决现有技术中命令词的召回率较低的缺陷。
本发明提供一种命令词识别方法,包括:
提取待激活语音指令的声学特征;
对所述声学特征进行解码,得到所述待激活语音指令的解码结果;所述解码结果包括所述待激活语音指令中候选命令词的得分和所述候选命令词的音节参数;
基于所述待激活语音指令的信噪比,以及所述候选命令词的音节参数,确定所述候选命令词的激活阈值;
若所述得分小于所述激活阈值,则确定所述候选命令词为所述语音指令的命令词。
根据本发明提供的一种命令词识别方法,所述对所述声学特征进行解码,得到所述待激活语音指令的解码结果,包括:
基于图解码网络,对所述声学特征进行解码,得到所述待激活语音指令的解码结果;
其中,所述图解码网络是基于样本命令词的声学特征及其对应的解码结果训练得到的。
根据本发明提供的一种命令词识别方法,所述样本命令词的声学特征是对原始样本命令词的语音数据进行降噪处理后提取的。
根据本发明提供的一种命令词识别方法,所述基于所述待激活语音指令的信噪比,以及所述候选命令词的音节参数,确定所述候选命令词的激活阈值,包括:
基于所述待激活语音指令的信噪比、所述候选命令词的音节参数以及所述候选命令词的激活阈值之间的映射关系,确定所述候选命令词的激活阈值。
根据本发明提供的一种命令词识别方法,所述提取待激活语音指令的声学特征,包括:
获取待激活的原始语音指令的语音数据;
对所述原始语音指令的语音数据进行降噪处理,得到所述待激活语音指令的语音数据,并对所述待激活语音指令的语音数据进行特征提取,得到所述待激活语音指令的声学特征。
根据本发明提供的一种命令词识别方法,所述确定所述候选命令词为所述待激活语音指令的命令词,之后还包括:激活所述待激活语音指令。
根据本发明提供的一种命令词识别方法,所述候选命令词的音节参数包括候选命令词的音节个数先验概率和/或音节类型先验概率。
本发明还提供一种命令词识别装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛景智能科技(嘉兴)有限公司,未经盛景智能科技(嘉兴)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110791226.8/2.html,转载请声明来源钻瓜专利网。