[发明专利]语音解码方法、装置、引擎及存储介质在审
申请号: | 202010155132.7 | 申请日: | 2020-03-06 |
公开(公告)号: | CN111402906A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 赵伟伟 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 解码 方法 装置 引擎 存储 介质 | ||
本发明公开了一种语音解码方法、装置、引擎及存储介质,所述方法应用于语音解码引擎,当接收到多个语音解码请求时,申请多个线程级解码通道,所述多个语音解码请求与所述多个线程级解码通道一一对应;利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求。由此,通过多个线程级解码通道并行处理多个语音解码请求,请求多个线程级解码通道共用一个通用模型,实现了语音解码的线程级的并行处理,降低了硬件成本,提高了语音解码的并发能力和解码效率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音解码方法、装置、引擎及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
语音解码是语音识别的重要组成部分。当前,一般基于通用模型对语音流数据进行解码获得该语音流数据对应的文本。若需要实现并行处理提高语音解码效率,则只能在进程级别通过部署更多的通用模型来实现,但是通用模型体积大,如此大大提升了硬件成本。
发明内容
本发明提供一种语音解码方法、装置、引擎及存储介质,旨在创建多个解码通道共用一个通用模型,实现线程级别的并行处理,降低硬件成本,提高语音解码的并发能力和解码效率。
为实现上述目的,本发明提供一种语音解码方法,所述方法包括:
当接收到多个语音解码请求时,申请多个线程级解码通道,所述多个语音解码请求与所述多个线程级解码通道一一对应;
利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求。
优选地,所述线程级解码通道包括通道解码单元、数据缓存区和回调接口单元;
所述利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求的步骤包括:
利用所述多个线程级解码通道的数据缓存区分别缓存所述多个语音解码请求中的语音流数据;
利用所述多个线程级解码通道的通道解码单元,分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果;
利用所述多个线程级解码通道的回调接口单元基于所述解码结果分别响应所述多个语音解码请求。
优选地,所述利用所述多个线程级解码通道的数据缓存区分别缓存所述多个语音解码请求中的语音流数据,包括:
针对所述多个线程级解码通道中任一特定线程级解码通道,查看所述特定线程级解码通道的数据缓存区的数据状态;
若所述特定线程级解码通道的数据缓存区的数据状态是等待数据,则直接将所述特定线程级解码通道对应的语音流数据暂存在所述特定线程级解码通道的数据缓存区;
若所述特定线程级解码通道的数据缓存区的数据状态是有数据,则将所述特定线程级解码通道对应的语音流数据暂存在所述特定线程级解码通道的数据缓存区的末尾。
优选地,所述利用所述多个线程级解码通道的通道解码单元,分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果的步骤包括:
利用所述多个线程级解码通道的通道解码单元,分别调用通用模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010155132.7/2.html,转载请声明来源钻瓜专利网。