[发明专利]解码网络构建方法、语音识别方法、装置、设备及存储介质有效
申请号: | 201910983196.3 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110610700B | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 高建清;王智国;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/08;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 网络 构建 方法 语音 识别 装置 设备 存储 介质 | ||
本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质,其中,解码网络构建方法包括:获取通用语言模型、领域语言模型、以及根据通用语言模型生成的通用解码网络,根据领域语言模型和通用语言模型生成领域解码网络,将领域解码网络融入通用解码网络,获得目标解码网络;语音识别方法包括:利用解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得待识别语音数据的解码路径,根据待识别语音数据的解码路径确定待识别语音数据的语音识别结果。本申请能够提高特定领域专业词汇的语音识别准确率。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种解码网络构建方法、语音识别方法、装置、设备及存储介质。
背景技术
语音识别基于语言模型实现,目前的语音识别方案大多为基于通用语言模型的识别方案。基于通用语言模型的识别方案为,首先将通用语言模型转换为通用解码网络,然后利用通用解码网络对待识别语音进行解码。
基于通用语言模型的识别方案能够对通用词汇进行准确识别,但对于一些特定领域的专业词汇而言,其很容易将专业词汇识别为发音相近的通用词汇,即现有的基于通用语言模型的识别方案对特定领域专业词汇的识别准确率较低。
发明内容
有鉴于此,本申请提供了一种解码网络构建方法、语音识别方法、装置、设备及存储介质,用以提高特定领域专业词汇的识别准确率,其技术方案如下:
一种解码网络构建方法,包括:
获取通用语言模型、领域语言模型、以及根据所述通用语言模型生成的通用解码网络;
根据所述领域语言模型和所述通用语言模型,生成领域解码网络;
将所述领域解码网络融入所述通用解码网络,获得目标解码网络。
可选的,所述根据所述通用语言模型和所述领域语言模型,生成领域解码网络,包括:
对所述通用语言模型和所述领域语言模型进行插值,其中,插值部分为所述领域语言模型和所述通用语言模型中、只在所述领域语言模型中出现的部分进行插值;
根据插值部分生成所述领域解码网络。
可选的,所述将所述领域解码网络融入所述通用解码网络,获得目标解码网络,包括:
将所述领域解码网络与所述通用解码网络进行串联,获得目标解码网络。
可选的,所述将所述领域解码网络与所述通用解码网络进行串联,包括:
分别针对所述通用解码网络和所述领域解码网络添加虚拟节点,所述虚拟节点包括起始节点和结束节点;
利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联。
可选的,所述利用所述起始节点和所述结束节点,将所述通用解码网络与所述领域解码网络进行串联,包括:
将针对所述通用解码网络创建的结束节点与针对所述领域解码网络创建的起始节点按结束节点指向起始节点进行有向连接;
将针对所述领域解码网络创建的结束节点与针对所述通用解码网络创建的起始节点按结束节点指向起始节点进行有向连接。
一种语音识别方法,包括:
利用上述一项所述的解码网络构建方法构建的目标解码网络对待识别语音数据进行解码,获得所述待识别语音数据的解码路径;
根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果。
可选的,所述根据所述待识别语音数据的解码路径,确定所述待识别语音数据的语音识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910983196.3/2.html,转载请声明来源钻瓜专利网。