[发明专利]一种指令词识别方法及装置有效

申请号：	202110386410.4	申请日：	2021-04-12
公开（公告）号：	CN113192501B	公开（公告）日：	2022-04-22
发明（设计）人：	李程帅;徐涛;牟杰	申请（专利权）人：	青岛信芯微电子科技股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/02;G10L15/06;G10L15/16
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	彭燕
地址：	266100 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种指令识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种指令词识别方法，其特征在于，包括：

对采集的音频信号进行语音识别，得到第一指令词；

确定所述第一指令词对应的第一相似词；所述第一相似词与所述第一指令词存在发音相似关系；

确定所述第一指令词在所述语音识别过程中的第一识别概率与所述第一相似词在所述语音识别过程中的第二识别概率；所述第一识别概率为根据所述第一指令词的音素序列对应得到；所述第二识别概率为根据所述第一相似词的音素序列对应得到；

若所述第一识别概率不小于所述第二识别概率，则输出所述第一指令词。

2.如权利要求1所述的方法，其特征在于，还包括：若所述第一识别概率小于所述第二识别概率，则返回对采集的音频信号进行语音识别的步骤，直至输出第二指令词或语音识别结束。

3.如权利要求2所述的方法，其特征在于，

对采集的音频信号进行语音识别，得到第一指令词，包括：

对采集的音频信号中的前N帧进行语音识别，得到第一指令词；

返回对采集的音频信号进行语音识别的步骤，直至输出第二指令词或语音识别结束，包括：

若采集的音频信号中第N帧之后的连续M帧存在非静音音素，则对第N帧之后的M帧进行语音识别，输出所述第二指令词。

4.如权利要求1所述的方法，其特征在于，还包括：

若所述第一指令词不存在对应的第一相似词，则输出所述第一指令词。

5.如权利要求1-4任一项所述的方法，其特征在于，对采集的音频信号进行语音识别，得到第一指令词，包括：

针对采集的音频信号中的任一音频帧，确定所述音频帧在各指令词对应的各音素的子概率；

根据各音频帧在各指令词对应的各音素的子概率，确定出识别概率最高的指令词；

若所述识别率最高的指令词满足第一识别阈值，则确定得到第一指令词。

6.如权利要求1-4任一项所述的方法，其特征在于，通过如下方式确定与所述第一指令词存在发音相似关系的所述第一相似词，包括：

确定被误识别为所述第一指令词的第三指令词；

将所述第三指令词中被误识别的音素序列作为所述第一指令词的第一相似词。

7.如权利要求1-4任一项所述的方法，其特征在于，确定所述第一指令词对应的第一相似词，包括：

确定所述第一识别概率满足第二识别阈值时，从所述第一指令词对应的k个相似词中选取p个与第一指令词相似度最高的相似词，作为所述第一相似词。

8.一种指令词识别装置，其特征在于，包括：

处理单元，用于对采集的音频信号进行语音识别，得到第一指令词；

确定单元，用于确定所述第一指令词对应的第一相似词；所述第一相似词与所述第一指令词存在发音相似关系；

所述处理单元，还用于若所述第一识别概率不小于所述第二识别概率，则输出所述第一指令词。

9.一种计算设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于调用所述存储器中存储的计算机程序，按照获得的程序执行权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行程序，所述计算机可执行程序用于使计算机执行权利要求1至7任一项所述的方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于青岛信芯微电子科技股份有限公司，未经青岛信芯微电子科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110386410.4/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载