[发明专利]语音关键词的识别方法和装置有效
申请号: | 201810096472.X | 申请日: | 2018-01-31 |
公开(公告)号: | CN108305617B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 王珺;苏丹;俞栋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/08;G10L15/16;G10L15/26 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 关键词 识别 方法 装置 | ||
1.一种语音关键词的识别方法,其特征在于,包括步骤:
基于待识别语音信号获得各第一语音片段;
基于预置的第一分类模型获得与各所述第一语音片段分别对应的各第一概率,所述第一概率包括该第一语音片段分别对应预定关键词的各预定分词单元的各概率;
基于所述待识别语音信号获得各第二语音片段,并生成各所述第二语音片段的第一预测特征,所述第一预测特征基于与该第二语音片段对应的各所述第一语音片段所对应的第一概率生成;
将各所述第一预测特征输入预置的第二分类模型,获得与各所述第二语音片段分别对应的各第二概率,所述第二概率包括该第二语音片段对应所述预定关键词的概率和/或非对应所述预定关键词的概率;
基于所述第二概率确定所述待识别语音信号中是否存在所述预定关键词。
2.根据权利要求1所述的方法,其特征在于:
当基于各所述第一概率和预定的决策逻辑判定所述待识别语音信号中存在所述预定关键词时,进入所述基于所述待识别语音信号获得各第二语音片段的步骤。
3.根据权利要求2所述的方法,其特征在于,基于各所述第一概率和预定的决策逻辑判定所述待识别语音信号中存在所述预定关键词的方式,包括:
确定当前待识别分词单元,所述当前待识别分词单元是基于各所述预定分词单元在所述预定关键词中的出现顺序,所确定的出现在最前的未作为过待识别分词单元的预定分词单元;
确定当前待判断语音片段,所述当前待判断语音片段是基于各所述第一语音片段在所述待识别语音信号中的出现顺序,所确定的出现在最前的未作为过待判断语音片段的第一语音片段;
当所述当前待判断语音片段对应所述当前待识别分词单元的概率大于预定阈值,且所述当前待识别分词单元不是所述预定关键词中出现在最后的所述预定分词单元时,返回所述确定当前待识别分词单元的步骤;
当所述当前待判断语音片段对应所述当前待识别分词单元的概率大于所述预定阈值,且所述当前待识别分词单元是所述预定关键词中出现在最后的所述预定分词单元时,判定所述待识别语音信号中存在所述预定关键词。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述当前待判断语音片段对应所述当前待识别分词单元的概率小于或等于所述预定阈值,且上一次判定大于所述预定阈值时所对应的待识别分词单元处于有效状态时,返回所述确定当前待判断语音片段的步骤;
当所述当前待判断语音片段对应所述当前待识别分词单元的概率小于或等于所述预定阈值,且上一次判定大于所述预定阈值时所对应的待识别分词单元处于无效状态时,将所述预定关键词的各所述预定分词单元中出现在最前的所述预定分词单元确定为当前待识别分词单元,并返回所述确定当前待判断语音片段的步骤。
5.根据权利要求1所述的方法,其特征在于,训练所述第一分类模型的方式,包括:
基于预定语料库获取样本语音信号,所述预定语料库包括通用语料库;
基于各所述样本语音信号获得第三语音片段;
获取各所述第三语音片段的第一声学特征和与各所述第三语音片段分别对应的各第三概率,所述第三概率包括该第三语音片段分别对应所述预定关键词的各预定分词单元的各概率;
基于各所述第三语音片段的第一声学特征和各所述第三概率对预定的第一神经网络模型进行训练,获得所述第一分类模型。
6.根据权利要求5所述的方法,其特征在于,训练所述第二分类模型的方式,包括:
基于各所述样本语音信号获得第四语音片段;
获取各所述第四语音片段的第二预测特征,所述第二预测特征基于与该第四语音片段对应的各第三语音片段所对应的第三概率生成;
获取与各所述第四语音片段分别对应的各第四概率,所述第四概率包括该第四语音片段对应所述预定关键词的概率和/或非对应所述预定关键词的概率;
基于各所述第四语音片段的第二预测特征和各所述第四概率对预定的第二神经网络模型进行训练,获得第二分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810096472.X/1.html,转载请声明来源钻瓜专利网。