[发明专利]一种语音理解方法、装置、设备及介质在审
申请号: | 202110199543.0 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112767928A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 唐浩雨 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 潘雪 |
地址: | 巴西班让路枫树*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 理解 方法 装置 设备 介质 | ||
本发明公开了一种语音理解方法、装置、设备及介质,用以解决现有无法快捷且准确地获取语音数据的语义识别结果的问题。由于预先训练有语音理解网络,且该语音理解网络是基于语义识别网络中的输入层分别与语音识别网络中的编码层以及输出层连接后的网络确定的,后续在语音理解的过程中,获取到了待处理的语音数据后,通过训练完成的语音理解网络,直接基于该语音数据,即可获取到该语音数据的语义识别结果,且该语义识别结果是结合语音识别网络中的编码层输出的结果确定的,提高了语义识别结果的准确性,也实现了快速地获取语音数据的语义识别结果。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音理解方法、装置、设备及介质。
背景技术
随着生活的发展,直播俨然成为人们日常生活中的一项比较常见的娱乐方式。在直播过程中,一般需要对数量繁杂的直播间主播的内容进行监管,包括图像和声音。其中,对于声音的监管,其主要是对直播中主播说出的语音内容的监管,通过对主播发出的语音数据进行语音识别,将语音数据转换成文字内容,基于该文字内容进行甄别,确定是否需要对该主播的直播间进行管制。因此,如何实现快捷且准确地获取语音数据的语义识别结果是近几年来人们日益关注的问题。
发明内容
本发明实施例提供了一种语音理解方法、装置、设备及介质,用以解决现有无法快捷且准确地获取语音数据的语义识别结果的问题。
本发明实施例提供了一种语音理解方法,所述方法包括:
获取待处理的语音数据;
通过预先训练完成的语音理解网络,确定所述语音数据的语义识别结果,其中,所述语音理解网络是基于语义识别网络中的输入层分别与语音识别网络中的编码层以及输出层连接后的网络确定的。
本发明实施例提供了一种语音理解装置,所述装置包括:
获取模块,用于获取待处理的语音数据;
确定模块,用于通过预先训练完成的语音理解网络,基于所述语音数据,确定所述语音数据的语义识别结果,其中,所述语音理解网络是基于语义识别网络中的输入层分别与语音识别网络中的编码层以及输出层连接后的网络确定的。
本发明实施例提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述语音理解方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述语音理解方法的步骤。
由于预先训练有语音理解网络,且该语音理解网络是基于语义识别网络中的输入层分别与语音识别网络中的编码层以及输出层连接后的网络确定的,后续在语音理解的过程中,获取到了待处理的语音数据后,通过训练完成的语音理解网络,直接基于该语音数据,即可获取到该语音数据的语义识别结果,且该语义识别结果是结合语音识别网络中的编码层输出的结果确定的,提高了语义识别结果的准确性,也实现了快速地获取语音数据的语义识别结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音识别网络的结构示意图;
图2为本发明实施例提供的一种语音理解过程示意图;
图3为本发明实施例提供的具体的语音理解流程示意图;
图4为本发明实施例提供的一种语音理解网络的结构示意图;
图5为本发明实施例提供的一种语音理解装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110199543.0/2.html,转载请声明来源钻瓜专利网。