[发明专利]语音识别方法及装置有效
申请号: | 201710517737.4 | 申请日: | 2017-06-29 |
公开(公告)号: | CN108288468B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 郑平;饶丰;卢鲤;李涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/10;G10L15/08;G10L15/28;G10L15/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 朱雅男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选识别 选择规则 目标结果 选择目标 语音识别 实时性 语音识别算法 计算机领域 语言模型 语音信号 困惑度 消耗 | ||
本发明公开了一种语音识别方法及装置,属于计算机领域。该方法包括:获取语音信号;根据语音识别算法对所述语音信号进行识别,得到n个候选识别结果;根据m种选择规则中执行顺序为j的选择规则确定所述n个候选识别结果中的目标结果;当根据所述执行顺序为j的选择规则未确定出所述目标结果时,根据执行顺序为j+1的选择规则确定所述n个候选识别结果中的所述目标结果;解决了根据RNN语言模型计算困惑度消耗的时间较长,导致从多个候选识别结果中选择目标结果的实时性较差的问题;提高了从n个候选识别结果中选择目标结果的实时性。
技术领域
本发明实施例涉及计算机领域,特别涉及一种语音识别方法及装置。
背景技术
语音识别技术是指通过语音识别设备将语音信息识别为文本信息的技术,语音识别技术广泛应用于语音拨号、语音导航、智能家居控制、语音搜索、听写数据录入等场景。由于同一发音的语音信号可能对应多组不同字的组合,比如:nihao对应“你好”、“拟好”、“倪浩”这三种组合,因此,语音识别设备根据语音信号可能识别出多个候选识别结果。当语音识别设备识别出多个候选识别结果时,如何选择出与语音信号匹配度最高的候选识别结果显得尤为重要。
在一种典型的语音识别方法中,语音识别设备获取到n个候选识别结果后,根据循环神经网络(Recurrent Neural Network,RNN)语言模型,计算每个候选识别结果的困惑度,将困惑度的最小值对应的候选识别结果确定为目标结果。其中,RNN语言模型是根据一个通用的语料库训练得到的,困惑度用于指示候选识别结果与语音信号的相似程度,且困惑度与该相似程度呈负相关关系;目标结果是指n个候选识别结果中与实际接收到的语音信号匹配度最大的候选识别结果,n为大于1的整数。
由于根据RNN语言模型计算困惑度消耗的时间较长,因此,从n个候选识别结果中选择目标结果的实时性较差。
发明内容
为了解决由于语音识别设备根据RNN语言模型计算困惑度消耗的时间较长,导致的从多个候选识别结果中选择目标结果的实时性较差的问题,本发明实施例提供了一种语音识别方法及装置。所述技术方案如下:
第一方面,提供了一种语音识别方法,所述方法包括:
获取语音信号;
根据语音识别算法对所述语音信号进行识别,得到n个候选识别结果,所述候选识别结果是指所述语音信号对应的文本信息,所述n为大于1的整数;
根据m种选择规则中执行顺序为j的选择规则确定所述n个候选识别结果中的目标结果,所述目标结果是指所述n个候选识别结果中与所述语音信号匹配度最高的候选识别结果,所述m为大于1的整数,所述j的初始值为1;
当根据所述执行顺序为j的选择规则未确定出所述目标结果时,根据执行顺序为j+1的选择规则确定所述n个候选识别结果中的所述目标结果。
第二方面,提供了一种候选识别结果选择装置,所述装置包括:
信号获取模块,用于获取语音信号;
语音识别模块,用于根据语音识别算法对所述信号获取模块获取到的所述语音信号进行识别,得到n个候选识别结果,所述候选识别结果是指所述语音信号对应的文本信息,所述n为大于1的整数;
第一确定模块,用于根据m种选择规则中执行顺序为j的选择规则确定所述语音识别模块识别出的所述n个候选识别结果中的目标结果,所述目标结果是指所述n个候选识别结果中与所述语音信号匹配度最高的候选识别结果,所述m为大于1的整数,所述j的初始值为1;
第二确定模块,用于当所述第一确定模块根据所述执行顺序为j的选择规则未确定出所述目标结果时,根据执行顺序为j+1的选择规则确定所述n个候选识别结果中的所述目标结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710517737.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法、装置及语音识别引擎
- 下一篇:一种音箱及交互方法