[发明专利]语音识别方法、装置、电子设备及存储介质有效
申请号: | 202110328573.7 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113066480B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 李俊博 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/183;G10L15/26 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
获取待识别语音数据的声学特征,并通过声学模型将所述声学特征处理为声学表示,其中,所述声学表示表征所述声学特征属于目标声学符号序列的概率;
在由多个语言模型对应的子图链接而成的搜索图中,搜索得到所述声学表示对应的多条解码路径,其中,所述多个语言模型以及链接关系由所述待识别语音数据所属的业务场景确定,每个所述语言模型对应的子图由声学符号节点链接而成;
从所述多条解码路径中确定目标解码路径,获取基于所述目标解码路径对所述声学表示解码得到的目标文本数据,并将所述目标文本数据确定为所述待识别语音数据的识别结果;
其中,在由多个语言模型对应的子图链接而成的搜索图中,搜索得到所述声学表示对应的多条解码路径之前,所述方法还包括:
确定在所述业务场景下进行语音识别时,待使用的所述多个语言模型,以及所述多个语言模型的关联关系,其中,所述关联关系用于表征所述多个语言模型应用在语音识别过程中的前后关系或并列关系;
构建每个所述语言模型对应的子图;
根据所述关联关系确定所述多个语言模型对应的子图之间的链接关系;
根据所述链接关系链接所述多个语言模型对应的子图,得到所述搜索图。
2.根据权利要求1所述的音识别方法,其特征在于,待使用的所述语言模型至少包括以下之一:
由所述业务场景的场景类型关联的第一语料训练得到第一语言模型;
由所述业务场景所属的领域类型关联的第二语料训练得到的第二语言模型;
由所述业务场景下的话术语料训练得到的第三语言模型;
由所述业务场景关联的对象的个性化信息料训练得到的第四语言模型;
基础语言模型。
3.根据权利要求1所述的音识别方法,其特征在于,构建每个所述语言模型对应的子图包括:
获取所述语言模型的词表;
根据所述声学模型的发音词典确定所述词表中的每个词对应的声学符号,得到多个声学符号;
建立所述多个声学符号对应的声学符号节点,以及由声学符号序列构成的词对应的词节点,其中,相同的声学符号对应同一个声学符号节点;
根据所述多个声学符号之间的跳转关系链接多个所述声学符号节点,并根据多个所述词节点之间的跳转关系链接多个所述词节点,得到所述语言模型对应的子图。
4.根据权利要求1所述的语音识别方法,其特征在于,根据所述链接关系链接所述多个语言模型对应的子图,得到所述搜索图包括:
构建所述搜索图的起始节点;
根据所述业务场景下的语音识别路径,构建所述识别路径的至少一组首尾节点,其中,每组所述首尾节点包括句首节点和句尾节点;
建立所述起始节点与每个所述句首节点之间的链接,并根据所述多个语言模型对应的子图之间的链接关系,将多个所述子图链接在所述至少一组首尾节点之间,得到所述搜索图,其中,每组所述首尾节点的所述句首节点和所述句尾节点之间至少链接有一个所述子图。
5.根据权利要求4所述的语音识别方法,其特征在于,从所述多条解码路径中确定目标解码路径包括:
在每条所述解码路径中,分别计算所述句首节点和所述句首节点链接的子图中之间的第一权重,计算相邻两个子图之间的第二权重,计算所述句尾节点和所述句尾节点链接的子图之间的第三权重,并基于所述声学特征属于所述目标声学符号序列的概率、所述第一权重、所述第二权重以及所述第三权重确定所述解码路径的语音识别权重;
在所述多条解码路径中确定语音识别权重最高的解码路径,并将所述语音识别权重最高的解码路径确定为所述目标解码路径。
6.根据权利要求2所述的语音识别方法,其特征在于,所述多个语言模型中包括所述第四语言模型,在根据所述链接关系链接所述多个语言模型对应的子图,得到所述搜索图之后,所述方法还包括:
在所述业务场景关联的对象发生变化的情况下,由变化后的对象的个性化信息料训练语言模型,并根据训练得到的语言模型更新所述第四语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110328573.7/1.html,转载请声明来源钻瓜专利网。