[发明专利]一种语音识别方法、装置、存储介质和电子设备在审
申请号: | 202111068780.X | 申请日: | 2021-09-13 |
公开(公告)号: | CN113539272A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 张一珂;冯晓冰;刘毅;马龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 存储 介质 电子设备 | ||
1.一种语音识别方法,其特征在于,应用于计算设备,所述方法包括:
从所述计算设备的存储器中获取待识别语音数据,对所述待识别语音数据进行语音识别,获得相应的各个候选文本,并基于所述各个候选文本各自对应的预估发音评估值和预估文本评估值,从所述各个候选文本中获得所述待识别语音数据对应的至少一个初始文本;
基于所述至少一个初始文本对应的文本特征,确定相应的目标领域,并基于所述目标领域对应的目标语言模型,分别获得所述各个候选文本各自对应的领域文本评估值;
根据所述各个候选文本各自对应的预估发音评估值、预估文本评估值和领域文本评估值,从所述各个候选文本中获得所述待识别语音数据对应的目标文本。
2.根据权利要求1所述的方法,其特征在于,所述基于所述各个候选文本各自对应的预估发音评估值和预估文本评估值,从所述各个候选文本中获得所述待识别语音数据对应的至少一个初始文本,包括:
根据所述各个候选文本各自对应的预估发音评估值和预估文本评估值,分别确定所述各个候选文本各自对应的综合评估值;
基于所述各个候选文本各自对应的综合评估值,从所述各个候选文本中获得所述待识别语音数据对应的至少一个初始文本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述各个候选文本各自对应的综合评估值,从所述各个候选文本中获得所述待识别语音数据对应的至少一个初始文本,包括:
按照所述综合评估值由高到低或由低到高的顺序,从所述各个候选文本中选取所述综合评估值小于设定阈值的至少一个候选文本,并将所述至少一个候选文本作为所述待识别语音数据对应的至少一个初始文本。
4.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个初始文本对应的文本特征,确定相应的目标领域,包括:
对所述至少一个初始文本中的各个初始文本分别进行特征提取,获得所述各个初始文本各自对应的文本特征;
根据所述各个初始文本各自对应的文本特征,分别确定所述各个初始文本各自对应的初始领域;
基于获得的所述各个初始文本各自对应的初始领域,确定所述待识别语音数据对应的目标领域。
5.根据权利要求4所述的方法,其特征在于,所述对所述至少一个初始文本中的各个初始文本分别进行特征提取,获得所述各个初始文本各自对应的文本特征,包括:
针对所述各个初始文本,分别执行以下操作:
获取一个初始文本包括的各个单词,并根据所述各个单词构建得到所述一个初始文本对应的单词序列;
分别确定所述各个单词各自在所述单词序列中的词频信息,并根据获得的各个词频信息,得到所述一个初始文本对应的文本特征。
6.根据权利要求4所述的方法,其特征在于,所述根据所述各个初始文本各自对应的文本特征,分别确定所述各个初始文本各自对应的初始领域,包括:
针对所述各个初始文本,分别执行以下操作:
根据一个初始文本对应的文本特征,确定所述一个初始文本属于各个预设领域的分类概率值;
将所述各个预设领域中,分类概率值符合第一设定条件的预设领域,作为所述一个初始文本对应的初始领域。
7.根据权利要求4所述的方法,其特征在于,所述基于获得的各个初始文本各自对应的初始领域,确定所述待识别语音数据对应的目标领域,包括:
基于所述各个初始文本各自对应的初始领域,确定对应同一初始领域的初始文本数量;
将所述初始文本数量符合第二设定条件对应的初始领域,作为所述待识别语音数据对应的目标领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111068780.X/1.html,转载请声明来源钻瓜专利网。