[发明专利]语音识别方法、装置、计算机设备和存储介质在审
申请号: | 202111501470.2 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114222028A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 赵新阳;范会善;王炼;罗贤桂;贺文明;黄振光;赵华;炊向军;董劲麟 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | H04M3/51 | 分类号: | H04M3/51;H04M3/523;G10L15/22;G10L15/26 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 伍健聪 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及语音识别方法、装置、计算机设备和存储介质。所述方法包括:接收呼叫请求,根据所述呼叫请求确定业务类型;确定所述业务类型对应的多个候选语音识别引擎,并基于所述多个候选语音识别引擎的负载信息,确定目标语音识别引擎;基于所述呼叫请求获取语音流,并将所述语音流发送至所述目标语音识别引擎,以便于所述目标语音识别引擎识别所述语音流,得到识别结果。采用本方法,在多种业务场景,都可以快速得到准确的语音识别结果。
技术领域
本申请涉及人工智能语音识别技术领域,特别是涉及语音识别方法、装置、计算机设备和存储介质。
背景技术
呼叫中心是企业对外服务的统一平台,近年来,随着智能语音识别技术的发展,呼叫中心也引入了语音识别技术,通过语音识别提高了整体的服务质量和服务效率。
企业提供的业务类型繁多,但是目前的语音识别方法,通常为每个话务台均配置通用的语音识别系统,没有区分不同的业务场景,所有业务场景下的语音流均采用通用的语音识别系统处理,导致一些业务场景无法得到准确的语音识别结果。
发明内容
基于此,有必要针对上述技术问题,提供在多种业务场景,都可以快速得到准确的语音识别结果的语音识别方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种语音识别方法。所述方法包括:
接收呼叫请求,根据所述呼叫请求确定业务类型;
确定所述业务类型对应的多个候选语音识别引擎,并基于所述多个候选语音识别引擎的负载信息,确定目标语音识别引擎;
基于所述呼叫请求获取语音流,并将所述语音流发送至所述目标语音识别引擎,以便于所述目标语音识别引擎识别所述语音流,得到识别结果。
在其中一个实施例中,所述呼叫请求为呼入请求,所述根据所述呼叫请求确定业务类型,包括:
根据所述呼入请求发送若干操作提示,并接收所述若干操作提示对应的若干业务编码;
获取所述呼入请求携带的接入码,并根据所述接入码和所述若干业务编码确定业务类型。
所述呼叫请求为呼出请求;所述根据所述呼叫请求确定业务类型,包括:
获取所述呼出请求携带的业务接入码,根据所述业务接入码确定业务类型。
在其中一个实施例中,所述负载信息包括:CPU空闲率、语音通道数阈值,以及当前语音通道数。
在其中一个实施例中,所述根据所述多个候选语音识别引擎的负载信息,确定目标语音识别引擎,包括:
根据每个候选语音识别引擎的语音通道数阈值和当前语音通道数,确定若干参考语音识别引擎;
在所述若干参考语音识别引擎中确定CPU空闲率最大的目标语音识别引擎。
在其中一个实施例中,所述业务类型为:语音导航-理财类型,或者语音导航-储蓄类型,或者语音转写-理财类型,或者语音转写-储蓄类型;
所述语音导航-理财类型对应的多个候选语音识别引擎,用于提取所述语音流中理财类型的关键字,所述语音导航-储蓄类型对应的多个候选语音识别引擎,用于提取所述语音流中储蓄类型的关键字;所述语音转写-理财类型对应的多个候选语音识别引擎,用于将所述语音流转换为理财类型的文本信息;所述语音转写-储蓄类型对应的多个候选语音识别引擎,用于将所述语音流转换为储蓄类型的文本信息。
第二方面,本申请还提供了一种语音识别装置。所述装置包括:
业务类型确定模块,用于接收呼叫请求,根据所述呼叫请求确定业务类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111501470.2/2.html,转载请声明来源钻瓜专利网。