[发明专利]解码网络构建方法、语音识别方法、装置、设备及存储介质有效
申请号: | 201910983196.3 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110610700B | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 高建清;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/08;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 网络 构建 方法 语音 识别 装置 设备 存储 介质 | ||
1.一种解码网络构建方法,其特征在于,包括:
获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;
根据所述领域语言模型和所述通用语言模型,生成领域解码网络;
将所述领域解码网络融入所述通用解码网络,获得目标解码网络;
其中,所述根据所述通用语言模型和所述领域语言模型,生成领域解码网络,包括:
对所述通用语言模型和所述领域语言模型进行插值,其中,插值部分为所述领域语言模型和所述通用语言模型中、在所述领域语言模型中出现的部分;
根据插值部分生成所述领域解码网络;
其中,所述将所述领域解码网络融入所述通用解码网络,获得目标解码网络,包括:
将所述领域解码网络与所述通用解码网络进行串联或并联,获得目标解码网络。
2.根据权利要求1所述的解码网络的构建方法,其特征在于,所述将所述领域解码网络与所述通用解码网络进行串联,包括:
分别针对所述通用解码网络和所述领域解码网络添加虚拟节点,所述虚拟节点包括起始节点和结束节点;
利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联。
3.根据权利要求2所述的解码网络的构建方法,其特征在于,所述利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联,包括:
将针对所述通用解码网络创建的结束节点与针对所述领域解码网络创建的起始节点按结束节点指向起始节点进行有向连接;
将针对所述领域解码网络创建的结束节点与针对所述通用解码网络创建的起始节点按结束节点指向起始节点进行有向连接。
4.一种语音识别方法,其特征在于,包括:
利用如权利要求1~3中任意一项所述的解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得所述待识别语音数据的解码路径;
根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果。
5.根据权利要求4所述的语音识别方法,其特征在于,所述根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果,包括:
通过预先获得的高阶语言模型和所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果;其中,所述高阶语言模型采用领域语言模型对通用语言模型进行插值得到。
6.根据权利要求4所述的语音识别方法,其特征在于,利用所述目标解码网络对所述待识别语音数据进行解码,获得所述待识别语音数据的解码路径包括:
将所述待识别语音数据的各个语音帧依次输入所述目标解码网络进行解码,获得所述待识别语音数据的解码路径;
其中,所述待识别语音数据的各个语音帧经所述目标解码网络中的两个起始节点分别进入所述目标解码网络中的通用解码网络和领域解码网络进行解码,当所述通用解码网络或所述领域解码网络中的候选解码路径包括结束节点时,从该结束节点跳回与该结束节点连接的至少一个起始节点,以进入所述通用解码网络和/或所述领域解码网络中继续解码,直至语音帧结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910983196.3/1.html,转载请声明来源钻瓜专利网。