[发明专利]一种关键词识别方法、装置、设备及可读存储介质有效
申请号: | 202010074563.0 | 申请日: | 2020-01-22 |
公开(公告)号: | CN111276124B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 徐超;宫云梅;浦宏杰;鄢仁祥 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16;G10L15/18;G10L15/26;G10L25/03 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 田媛媛 |
地址: | 215011 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键词 识别 方法 装置 设备 可读 存储 介质 | ||
1.一种关键词识别方法,其特征在于,包括:
对连续语音信号中的帧信号进行语音激活检测,获得并缓存每一帧信号对应的语音激活标志;
对缓存的各个所述语音激活标志进行统计,并利用统计结果确定缓存的各个所述语音激活标志对应的目标语音信号是否存在语音段;
如果是,则对所述连续语音信号中的帧信号进行特征提取,获得每一帧信号对应的声音特征并将所述声音特征存入特征矩阵中;对所述目标语音信号对应的特征矩阵进行关键词识别后,将缓存的所述语音激活标志清零;其中,所述特征矩阵包括每一帧信号对应的梅尔频率倒数系数;
如果否,则继续对所述连续语音信号中的未检测帧信号进行语音激活检测;
其中,所述对缓存的各个所述语音激活标志进行统计,并利用统计结果确定缓存的各个所述语音激活标志对应的目标语音信号是否存在语音段,包括:
统计缓存的各个所述语音激活标志中连续有语音激活标志的比例或个数;
判断所述比例是否大于语音比例,或判断所述个数是否大于语音个数;
如果是,则确定所述目标语音信号有语音段;
如果否,则确定所述目标语音信号无语音段;
其中,对所述目标语音信号对应的特征矩阵进行关键词识别,包括:
利用关键词识别模型对所述特征矩阵进行推理,获得分类标签得分数组;
从所述分类标签得分数组中筛选出目标关键词索引;
在所述目标关键词索引的得分大于分数阈值时,输出所述目标关键词索引对应的目标关键词;
在所述目标关键词索引的得分小于等于分数阈值时,输出无检测结果的提示信息。
2.根据权利要求1所述的关键词识别方法,其特征在于,所述对连续语音信号中的帧信号进行语音激活检测,获得并缓存每一帧信号对应的语音激活标志的步骤,包括:
从缓存读取所述连续语音信号对应的每一帧信号,并对每一帧信号进行语音激活检测,获得每一帧信号对应的所述语音激活标志;
按照先入先出方式对缓存的所述语音激活标志进行更新。
3.根据权利要求1所述的关键词识别方法,其特征在于,对所述连续语音信号中的帧信号进行特征提取,获得每一帧信号对应的声音特征并将所述声音特征存入特征矩阵中,包括:
对所述连续语音信号中的帧信号进行梅尔频率倒数系数提取,获得每一帧信号对应的梅尔频率倒数系数并存入特征矩阵中。
4.根据权利要求2所述的关键词识别方法,其特征在于,在输出所述目标关键词索引对应的目标关键词之后,还包括:
判断所述连续语音信号的帧信号是否已完成语音激活检测;
如果否,则执行所述继续对所述连续语音信号中的未检测帧信号进行语音激活检测的步骤;
如果是,则输出关键词识别已完成的提示信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010074563.0/1.html,转载请声明来源钻瓜专利网。