[发明专利]一种语音识别方法、装置、设备和存储介质有效
申请号: | 201811508402.7 | 申请日: | 2018-12-11 |
公开(公告)号: | CN110176230B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/22;G10L15/06 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
加载预设的第一状态图和第二状态图,所述第一状态图为关键词语言模型的状态图,所述第二状态图为大语言模型的状态图;
在所述第一状态图中提取基准边,在所述第二状态图中查找与所述基准边标签相同的边,作为关键词边;
若在所述第二状态图中未找到与所述基准边标签相同的边,则将所述基准边映射到所述第二状态图中,所述将所述基准边映射到所述第二状态图中包括:确定所述基准边对应的起始节点,根据所述基准边对应的起始节点建立与所述基准边相同的虚拟边,作为关键词边;
获取所述基准边的权重,根据基准边的权重更新所述关键词边的权重;
将所述第二状态图中关键词边更新后的权重,配置为语言识别模型中对应边的激励权重,所述语言识别模型为所述大语言模型剪枝后的语言模型;
在所述第二状态图中,筛选出标签与预设词表中的词相同的边,作为关键词起始边;
获取所述关键词起始边的初始权重,根据预设的比例系数和所述关键词起始边的初始权重,更新所述关键词起始边的权重;
将所述第二状态图中关键词起始边更新后的权重,配置为语言识别模型中对应边的激励权重;
将待识别语音输入预设语音识别模型,得到所述语音识别模型输出的词序列路径,所述语音识别模型包括所述语言识别模型;
根据所述语言识别模型中边的激励权重,在所述词序列路径中选出目标路径,得到语音识别结果。
2.如权利要求1所述的方法,其特征在于,所述在所述第一状态图中提取基准边,包括:
获取所述第一状态图的起始节点,根据预设的遍历深度和所述起始节点确定基准边。
3.如权利要求2所述的方法,其特征在于,所述根据预设的遍历深度和所述起始节点获取基准边,包括:
将所述起始节点的输出边确定为第一基准边;
在预设的递归深度内,对所述第一基准边进行递归,获取所述第一基准边的递归边;
若所述递归边的输出标签不是预设符号,则将所述递归边确定为第二基准边。
4.如权利要求3所述的方法,其特征在于,在所述第二状态图中查找与所述基准边标签相同的边,作为关键词边,包括:
在所述第二状态图中,查找与所述第一基准边标签相同的边,作为第一关键词边;
在所述第一关键词边的递归边中,查找与所述第二基准边标签相同的边,作为第二关键词边。
5.如权利要求1所述的方法,其特征在于,所述根据基准边的权重更新所述关键词边的权重,包括:
获取预设的插值参数及所述关键词边的初始权重;
根据所述基准边的权重、插值参数和关键词边的初始权重,计算得到关键词边的目标权重;
使用所述目标权重,替换所述第二状态图中所述关键词边的初始权重。
6.如权利要求1所述的方法,其特征在于,所述在所述第二状态图中,筛选出标签与预设词表中的词相同的边,作为关键词起始边之前,包括:
对所述关键词进行分词处理,将分词得到的第一个词配置到预设的词表中。
7.如权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
获取预设的关键词,根据所述关键词训练关键词语言模型;
构建所述关键词语言模型的加权有限状态转换器,获取所述关键词语言模型加权有限状态转换器指示的状态图为第一状态图。
8.如权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
获取预设的通用语料,根据所述通用语料训练大语言模型;
构建所述大语言模型的加权有限状态转换器,获取所述大语言模型加权有限状态转换器指示的状态图为第二状态图。
9.如权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
实时采集待识别语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811508402.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音处理方法和装置
- 下一篇:音响输出系统、音响输出方法及存储介质