[发明专利]基于自动柜员机业务逻辑的语音识别处理方法和装置在审
申请号: | 202111629658.5 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114267341A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 梁升荣;王曼;罗秉安;王永隆 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/08;G10L15/22;G07F19/00 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 周玲 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自动柜员机 业务 逻辑 语音 识别 处理 方法 装置 | ||
本申请涉及一种基于自动柜员机业务逻辑的语音识别处理方法、装置、计算机设备、存储介质和计算机程序产品,可用于人工智能技术领域。本申请能够提升对用户输入的语音指令的识别效率,与传统的语音识别方案相比,减少了计算量,进一步提高了语音识别速度和识别准确度,从而提升了自动柜员机上的用户体验。该方法包括:获取用户语音音频,并识别当前业务状态;基于当前业务状态从预设的指令库中筛选得到可执行指令集;基于可执行指令集构造状态网络;基于用户语音音频,利用路径搜索算法从状态网络中搜索得到全局最优路径;将全局最优路径转换为语音指令;根据语音指令指示自动柜员机进行相应的动作。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于自动柜员机业务逻辑的语音识别处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着信息技术以及互联网的发展,各行各业都开始了数字化进程。传统的银行服务也开始了数字化步伐,人们不需要像过去一样需要抽出大量时间亲自去银行网点办理业务,ATM(Automated Teller Machine,自动柜员机)上的取款服务也变得越来越智能化,可通过文字、语音为用户提供更快捷、高效的服务器。
目前的ATM自助服务中,用户经过身份识别后,可通过ATM机的语音提示在键盘上输入指令,例如服务项目编码、取款金额等才能够完成相关服务功能。然而,目前的服务模式中需要用户自己输入指令却不能准确的获取用户的语音指令并准确执行相应的执行动作,这种服务方式还不够快捷智能,仍然不能满足用户的存款或取款效率。
发明内容
基于此,有必要针对上述技术问题,提供一种基于自动柜员机业务逻辑的语音识别处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种基于自动柜员机业务逻辑的语音识别处理方法。所述方法包括:
获取用户语音音频,并识别当前业务状态;
基于所述当前业务状态从预设的指令库中筛选得到可执行指令集;
基于所述可执行指令集构造状态网络;
基于所述用户语音音频,利用路径搜索算法从所述状态网络中搜索得到全局最优路径;
将所述全局最优路径转换为语音指令;
根据所述语音指令指示自动柜员机进行相应的动作。
在其中一个实施例中,所述基于所述可执行指令集构造状态网络,包括:
将所述可执行指令集转换为单词网络;
将所述单词网络转换为音素网络;
将所述音素网络转换为所述状态网络;其中,每个音素对应多个状态。
在其中一个实施例中,所述基于所述用户语音音频,利用路径搜索算法从所述状态网络中搜索得到全局最优路径,包括:
针对所述用户语音音频进行语音边界检测,得到有效语音音频;
针对所述有效语音音频进行分帧处理,得到多帧语音信号;
根据每一帧所述语音信号的特征参数得到每一帧语音信号对应的多维向量;
基于所述多维向量,利用路径搜索算法在所述可执行指令集对应的状态网络中搜索最佳路径,得到所述全局最优路径。
在其中一个实施例中,所述全局最优路径包括多个目标状态;所述将所述全局最优路径转换为语音指令,包括:
依据目标状态与目标音素的对应关系,将所述多个目标状态组合成多个目标音素;
将所述多个目标音素组合成目标单词;
根据所述目标单词构建所述语音指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111629658.5/2.html,转载请声明来源钻瓜专利网。