[发明专利]语音数据处理方法、装置及存储介质在审

申请号：	202010136193.9	申请日：	2020-03-02
公开（公告）号：	CN111462741A	公开（公告）日：	2020-07-28
发明（设计）人：	韩立籼;苏少炜;陈孝良;常乐	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G06F40/30
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	邢少真
地址：	100080 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音数据处理方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开揭示了一种语音数据处理方法、装置及存储介质，属于人工智能技术领域。所述方法包括：首先通过对接收到的语音数据进行语音识别处理，获取语音数据对应的第一文本数据；然后对第一文本数据进行第一层语义解析，获得第一文本数据的有效性属性，其中有效性属性用于指示第一文本数据为有效数据或者无效数据；最后根据有效性属性，对第一文本数据进行语音数据响应或者结束所述语音数据处理。通过上述方案，通过设置双层过滤层进行局部的语义解析可以判断语音数据的有效性，大大降低了进行无意义的第二层语义解析的数量，提高了对输入语音响应的准确率。

技术领域

本公开涉及人工智能技术领域，特别是涉及一种语音数据处理方法、装置及存储介质。

背景技术

目前，随着人工智能技术的日益发展，语音识别技术作为其中的中重要的一部分可以应用在智能音箱的交互场景下。

在相关技术中，通过智能音箱识别一段声音时，由于实际场景下的声音会掺杂部分无意义的语气词，与声音中的主体语音的含义无关，所以需要对声音进行过滤之后，再对过滤后的语音进行语义解析。声音进行过滤的内容可以是通过预先设置的一些无意义的语气词，通过自动过滤掉与声音中的预先设置的语气词，得到过滤后的需要进行语义分析的声音。

然而，相关技术中的方案仅对无意义的语气词进行过滤，对于语气词之外的其它无意义的内容都进行响应，从而导致对输入语音的响应的准确性不高。

发明内容

本公开提供一种语音数据处理方法、装置及存储介质。所述技术方案如下：

根据本公开实施例的第一方面，提供了一种语音数据处理方法，其特征在于，所述方法包括：

对接收到的语音数据进行语音识别处理，获取所述语音数据对应的第一文本数据；

对所述第一文本数据进行第一层语义解析，获得所述第一文本数据的有效性属性，所述有效性属性用于指示所述第一文本数据为有效数据或者无效数据；

根据所述有效性属性，对所述第一文本数据进行语音数据响应或者结束所述语音数据处理。

可选的，所述对接收到的语音数据进行语音识别处理，获取所述语音数据对应的第一文本数据，包括：

对所述语音数据进行语音识别处理，获得语音识别文本；

根据预先设置的黑名单对所述语音识别文本进行匹配；所述黑名单中包括唤醒词以及高频语气词中的至少一种；

从所述语音识别文本中删除与所述黑名单匹配的内容，获得所述第一文本数据。

可选的，所述根据所述有效性属性，对所述第一文本数据进行第二层语义解析或者结束所述语音数据处理，包括：