[发明专利]解码网络生成方法、语音识别方法、装置、设备及介质有效
申请号: | 201910745811.7 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110428819B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 黄羿衡;贺利强;苏丹 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 网络 生成 方法 语音 识别 装置 设备 介质 | ||
本申请基于人工智能技术针对语音识别应用场景提供了解码网络生成方法和一种智能语音交互系统,在该方法提出了基于差分结构的解码网络架构,由基础解码网络和槽位对应的差分语言模型构成解码网络,其中,基础解码网络是通过类语言模型和类语言模型中槽位对应的基础压缩语言模型构建生成的。当存在新增词条需要对解码网络进行更新时,仅需通过对目标槽位对应的差分语言模型进行更新。该能够支持超大槽位的解码网络的构建,由于基础解码网络只需要建立一次,一旦有新的实例需要添加至解码网络时,只需要更新槽位对应的差分语言模型,不需要重新构建大的解码网络,如此能够加快解码网络的迭代更新速度,以支持实时性要求较高的业务场景。
本申请对申请号为201910424817.4,申请日为2019年05月21日,发明创造名称为“解码网络生成方法、语音识别方法、装置、设备及介质”的中国专利申请提出分案申请。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种解码网络生成方法、语音识别方法、装置、设备及计算机可读存储介质。
背景技术
随着语音识别技术的快速发展,各种支持语音识别功能的智能产品已经逐渐深入到用户工作生活的各个角落,例如智能机器人、智能车载设备,等等,这类智能产品通过语音识别功能为用户提供更智能的服务。
在实际应用中,这类智能产品需要不断地将应用场景中新增的词条更新至解码网络中,以保证智能产品能够及时适配不断变化的场景;所谓解码网络实际上是状态网络,语音识别过程实际上就是在状态网络中搜索一条与语音最匹配的路径,这个过程也称为解码过程。
在相关技术中基于静态解码网络的方式进行解码,所谓静态解码网络是指将所有知识源统一编译在一个状态网络中,在解码过程中,根据节点间的转移权重获得概率信息,这种方式导致当有新增词条产生时,就需要重新构建整个解码网络,而重新构建一个解码网络往往一周时间,如此,导致解码网络的迭代更新速度无法适配应用场景的词条更新速度,导致智能产品的更新迭代受限。
发明内容
本申请实施例提供了一种解码网络生成方法、装置、设备及存储介质,在有新增词条产生的情况下无需重新构建整个解码网络,即可实现解码网络的更新,加快解码网络迭代更新的速度。
有鉴于此,本申请第一方面提供了一种解码网络生成方法,包括:
根据第一训练样本集训练得到目标槽位对应的语言模型,对所述语言模型和所述目标槽位对应的基础压缩语言模型进行差值,得到所述目标槽位对应的差分语言模型;
根据所述差分语言模型和基础解码网络构建目标解码网络;其中,所述基础解码网络是通过类语言模型和所述类语言模型中的槽位对应的基础压缩语言模型构建生成的;其中,所述基础压缩语言模型是对通过第二训练样本集训练所得的槽位对应的语言模型进行裁剪生成的,所述第二训练样本集是所述第一训练样本集的子集。
本申请第二方面提供了一种语音识别方法,包括:
获取待识别的语音;
通过解码网络中基础解码网络对所述语音进行解码,在解码过程中,当解码到达所述基础解码网络中槽位时,通过所述解码网络中所述槽位对应的差分语言模型进行解码,并保存所述解码网络的当前网络状态、所述槽位对应的差分语言模型的标识和当前网络状态以及所述解码网络的历史搜索状态;以及,当所述槽位解码完成时,跳转至所述基础解码网络继续解码直到解码至所述语音的最后一帧。
本申请第三方面提供了一种语音交互系统,包括:
语音采集设备,用于通过麦克风采集用户输入的语音;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910745811.7/2.html,转载请声明来源钻瓜专利网。