[发明专利]语音识别方法及装置有效
申请号: | 201710517737.4 | 申请日: | 2017-06-29 |
公开(公告)号: | CN108288468B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 郑平;饶丰;卢鲤;李涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/10;G10L15/08;G10L15/28;G10L15/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 朱雅男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选识别 选择规则 目标结果 选择目标 语音识别 实时性 语音识别算法 计算机领域 语言模型 语音信号 困惑度 消耗 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取语音信号;
根据语音识别算法对所述语音信号进行识别,得到n个候选识别结果,所述候选识别结果是指所述语音信号对应的文本信息,所述n为大于1的整数;
根据m种选择规则中执行顺序为j的选择规则确定所述n个候选识别结果中的目标结果,所述目标结果是指所述n个候选识别结果中与所述语音信号匹配度最高的候选识别结果,所述m为大于1的整数,所述j的初始值为1;
当根据所述执行顺序为j的选择规则未确定出所述目标结果时,根据执行顺序为j+1的选择规则确定所述n个候选识别结果中的所述目标结果。
2.根据权利要求1所述的方法,其特征在于,所述m种选择规则的执行顺序根据各自的算法复杂程度确定,所述执行顺序与所述算法复杂程度呈正相关关系。
3.根据权利要求1所述的方法,其特征在于,所述m种选择规则包括命令选择规则、功能选择规则和对话选择规则中的至少两种,所述命令选择规则的算法复杂程度低于所述功能选择规则的算法复杂程度,所述功能选择规则的算法复杂程度低于所述对话选择规则的算法复杂程度,
所述命令选择规则用于指示语音识别设备根据命令词库中是否包括与第i个候选识别结果相匹配的命令关键词来检测所述第i个候选识别结果是否为所述目标结果,1≤i≤n;
所述功能选择规则用于指示所述语音识别设备根据语音词库中是否包括与语音关键词相匹配的词库关键词来检测所述第i个候选识别结果是否为所述目标结果,所述语音关键词是所述第i个候选识别结果中的至少一个关键词;
所述对话选择规则用于指示所述语音识别设备根据训练出的语言模型确定每个候选识别结果与所述语音信号的相似程度来选择所述目标结果。
4.根据权利要求3所述的方法,其特征在于,根据所述命令选择规则,确定所述n个候选识别结果中的目标结果,包括:
检测所述命令词库的第一对应关系是否包括所述与第i个候选识别结果相匹配的命令关键词,1≤i≤n;
在所述第一对应关系包括所述与第i个候选识别结果相匹配的命令关键词时,确定所述第i个候选识别结果为所述目标结果;
其中,所述第一对应关系至少包括所述命令关键词。
5.根据权利要求4所述的方法,其特征在于,所述检测所述命令词库的第一对应关系是否包括所述与第i个候选识别结果相匹配的命令关键词之后,还包括:
在所述第一对应关系不包括与所述n个候选识别结果中的任意一个候选识别结果相匹配的命令关键词时,检测所述命令词库中的第二对应关系是否包括与所述第i个候选识别结果中的任意一个字相匹配的关键字;
在所述第二对应关系包括与所述第i个候选识别结果中的字相匹配的关键字时,根据所述第二对应关系中所述关键字对应的索引值,在所述第一对应关系中查找所述索引值对应的命令关键词;
确定所述第i个候选识别结果与所述命令关键词之间的编辑距离,所述编辑距离用于指示所述第i个候选识别结果转换为所述命令关键词所需执行的操作次数;
在所述编辑距离小于预设数值时,确定所述第i个候选识别结果为所述目标结果;
其中,所述第一对应关系包括所述索引值与所述命令关键词之间的对应关系,所述第二对应关系包括所述索引值与所述关键字之间的对应关系。
6.根据权利要求3所述的方法,其特征在于,根据所述功能选择规则,选择所述n个候选识别结果中的目标结果,包括:
分析第i个候选识别结果的功能模板,1≤i≤n;
检测所述语音词库是否包括与所述第i个候选识别结果中的所述语音关键词相匹配的所述词库关键词;
在所述语音词库包括与所述第i个候选识别结果中的语音关键词相匹配的所述词库关键词时,将所述第i个候选识别结果确定为所述目标结果,所述语音关键词是所述第i个候选识别结果中的至少一个关键词;
其中,所述第i个候选识别结果包括所述功能模板和所述语音关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710517737.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法、装置及语音识别引擎
- 下一篇:一种音箱及交互方法