[发明专利]语音解码方法、装置及存储介质有效
申请号: | 201811536173.X | 申请日: | 2018-12-14 |
公开(公告)号: | CN110164421B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 黄羿衡;简小征;贺利强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/06;G10L15/14;G10L15/16;G10L15/18;G10L15/22;G10L15/26;G10L19/008 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 解码 方法 装置 存储 介质 | ||
本发明公开了一种语音解码方法、装置及存储介质,属于语音识别技术领域。所述方法包括:从第一令牌列表中获取最小解码分数对应的目标令牌,第一令牌列表包括对上一音频帧进行解码得到的第一令牌,第一令牌包括在不同解码网络中进行解码形成的状态对及其解码分数;根据目标令牌和当前音频帧的声学向量,确定对当前音频帧进行解码时的剪枝参数;根据第一令牌列表、剪枝参数及声学向量,对当前音频帧进行解码。本发明无需生成高阶语言模型对应的解码网络,基于低阶语言模型和差分语言模型对应的解码网络进行解码,在确保解码精度的前提下,节省了计算资源和存储资源。且根据对上一音频帧的解码结果,对当前音频帧的解码进行解码,提高了解码速度。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音解码方法、装置及存储介质。
背景技术
语音识别技术也称为ASR(Automatic Speech Recognition,自动语音识别),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,包括按键、二进制编码或者字符序列等,从而实现人机交互。语音识别技术在现代生活中具有广泛的应用场景,可应用于车载导航、智能家居、语音拨号、同声传译等场景中。解码器作为语音识别系统的核心,基于解码器的语音解码过程在整个语音识别过程中发挥着重要作用,直接影响着识别结果的准确性。
目前,基于解码器的语音解码过程为:获取高阶语言模型,并采用通用的openfst工具在高阶语言模型上生成解码网络,进而基于该解码网络进行语音解码。
然而,高阶语言模型的内存较大,基于高阶语言模型所生成的解码网络的内存又比高阶语言模型的内存大的多,这就需要配置大量的存储资源及计算资源,在存储资源及计算资源有限的场景下,很难实现解码,因此,亟需一种兼顾解码速度及解码精度的语音解码方法。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种语音解码方法、装置及存储介质。所述技术方案如下:
一方面,提供了一种语音解码方法,所述方法包括:
从第一令牌列表中获取最小解码分数对应的目标令牌,所述第一令牌列表包括对上一音频帧进行解码得到的多个第一令牌,所述第一令牌包括在不同解码网络中进行解码形成的状态对及其解码分数,所述状态对用于表征低阶语言模型对应的第一解码网络中的第一状态和差分语言模型对应的第二解码网络中的第二状态之间的对应关系;
根据所述目标令牌和当前音频帧的声学向量,确定对所述当前音频帧进行解码时的剪枝参数,所述剪枝参数用于对所述当前音频帧的解码过程进行约束;
根据所述第一令牌列表、所述剪枝参数及所述声学向量,对所述当前音频帧进行解码。
另一方面,提供了一种语音解码装置,所述装置包括:
获取模块,用于从第一令牌列表中获取最小解码分数对应的目标令牌,所述第一令牌列表包括对上一音频帧进行解码得到的多个第一令牌,所述第一令牌包括在不同解码网络中进行解码形成的状态对及其解码分数,所述状态对用于表征低阶语言模型对应的第一解码网络中的第一状态和差分语言模型对应的第二解码网络中的第二状态之间的对应关系;
确定模块,用于根据所述目标令牌和当前音频帧的声学向量,确定对所述当前音频帧进行解码时的剪枝参数,所述剪枝参数用于对所述当前音频帧的解码过程进行约束;
解码模块,用于根据所述第一令牌列表、所述剪枝参数及所述声学向量,对所述当前音频帧进行解码。
另一方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现语音解码方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811536173.X/2.html,转载请声明来源钻瓜专利网。