[发明专利]语音数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202010859300.0 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112002323A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 郝正鸿;许开河;张涛;叶洋甫;付艳平 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G06K9/62;G06F16/33;G06F40/211;G06F40/279 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;孙芬 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音数据处理方法,其特征在于,所述语音数据处理方法包括:
接收用户输入的语音信息;
识别所述语音信息,得到对应的自然语言文本信息;
调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;
匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;
调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;
根据所述标识序列获取结构化的流程代码。
2.根据权利要求1所述的语音数据处理方法,其特征在于,所述识别所述语音信息,得到对应的自然语言文本信息的步骤包括:
检测所述语音信息中是否包含错误信息以及语音纠错信息;
当检测结果为所述语音信息中包含错误信息以及语音纠错信息时,确定所述错误信息在所述语音信息中的目标位置;
获取所述目标位置对应的错误信息与语音纠错信息;
根据所述语音纠错信息纠正所述错误信息,得到目标语音信息;
将所述目标语音信息输入至语音识别模型中,得到对应的自然语言文本信息。
3.根据权利要求2所述的语音数据处理方法,其特征在于,所述检测所述语音信息中是否包含错误信息的步骤包括:
检测所述语音信息中是否包含预设关键字;
当检测结果为所述语音信息中包含预设关键字时,确定所述语音信息中包含错误信息。
4.根据权利要求1所述的语音数据处理方法,其特征在于,所述流程类型识别模型的训练方法包括:
获取流程类型标注数据,其中,所述流程类型标注数据包括流程类型观察序列与流程类型标识序列;
调用预训练的语言模型解析所述流程类型标注数据,得到词语级和句子级的embedding结果;
基于所述embedding结果调整初始流程类型识别模型。
5.根据权利要求1所述的语音数据处理方法,其特征在于,所述匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型的步骤包括:
调用多线程队列获取所述流程类型集中每一流程类型;
确定所述流程类型与所述流程要素抽取模型的映射关系;
根据所述映射关系确定目标流程要素抽取模型,其中,所述目标流程要素存储在区块链中。
6.根据权利要求1所述的语音数据处理方法,其特征在于,所述根据所述标识序列获取结构化的流程代码的步骤包括:
获取所述自然语言文本信息包含的所述流程类型携带的标记信息;
获取与所述流程类型对应的所述标识序列,并根据所述标记信息确定所述标识序列的执行顺序;
按照所述执行顺序遍历语法库,得到与所述标识序列对应的可执行计算机代码。
7.根据权利要求1所述的语音数据处理方法,其特征在于,在所述接收用户输入的语音信息的步骤之后,所述方法还包括:
计算所述语音信息的清晰度;
检测所述清晰度是否超过预设清晰度阈值;
当检测结果为所述语音信息的清晰度未超过预设清晰度阈值时,提示用户重新输入语音信息。
8.一种语音数据处理装置,其特征在于,所述语音数据处理装置包括:
信息接收模块,用于接收用户输入的语音信息;
信息识别模块,用于识别所述语音信息,得到对应的自然语言文本信息;
类型确定模块,用于调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;
模型匹配模块,用于匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;
要素抽取模块,用于调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;
代码获取模块,用于根据所述标识序列获取结构化的流程代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010859300.0/1.html,转载请声明来源钻瓜专利网。