[发明专利]语音解码方法、装置、引擎及存储介质在审

申请号：	202010155132.7	申请日：	2020-03-06
公开（公告）号：	CN111402906A	公开（公告）日：	2020-07-10
发明（设计）人：	赵伟伟	申请（专利权）人：	深圳前海微众银行股份有限公司
主分类号：	G10L19/008	分类号：	G10L19/008
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	王韬
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音解码方法装置引擎存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音解码方法、装置、引擎及存储介质，所述方法应用于语音解码引擎，当接收到多个语音解码请求时，申请多个线程级解码通道，所述多个语音解码请求与所述多个线程级解码通道一一对应；利用所述多个线程级解码通道分别调用通用模型，对所述多个语音解码请求中的语音流数据进行并行解码处理，获得解码结果，并基于所述解码结果响应所述多个语音解码请求。由此，通过多个线程级解码通道并行处理多个语音解码请求，请求多个线程级解码通道共用一个通用模型，实现了语音解码的线程级的并行处理，降低了硬件成本，提高了语音解码的并发能力和解码效率。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音解码方法、装置、引擎及存储介质。

背景技术

随着计算机技术的发展，越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，但由于金融行业的安全性、实时性要求，也对技术提出了更高的要求。

语音解码是语音识别的重要组成部分。当前，一般基于通用模型对语音流数据进行解码获得该语音流数据对应的文本。若需要实现并行处理提高语音解码效率，则只能在进程级别通过部署更多的通用模型来实现，但是通用模型体积大，如此大大提升了硬件成本。

发明内容

本发明提供一种语音解码方法、装置、引擎及存储介质，旨在创建多个解码通道共用一个通用模型，实现线程级别的并行处理，降低硬件成本，提高语音解码的并发能力和解码效率。

为实现上述目的，本发明提供一种语音解码方法，所述方法包括：

当接收到多个语音解码请求时，申请多个线程级解码通道，所述多个语音解码请求与所述多个线程级解码通道一一对应；

利用所述多个线程级解码通道分别调用通用模型，对所述多个语音解码请求中的语音流数据进行并行解码处理，获得解码结果，并基于所述解码结果响应所述多个语音解码请求。

优选地，所述线程级解码通道包括通道解码单元、数据缓存区和回调接口单元；

所述利用所述多个线程级解码通道分别调用通用模型，对所述多个语音解码请求中的语音流数据进行并行解码处理，获得解码结果，并基于所述解码结果响应所述多个语音解码请求的步骤包括：