[发明专利]垃圾指令识别方法及装置在审

申请号：	202011521158.5	申请日：	2020-12-21
公开（公告）号：	CN112802452A	公开（公告）日：	2021-05-14
发明（设计）人：	胡晓慧;孟振南;雷欣;李志飞	申请（专利权）人：	出门问问（武汉）信息科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26;G06N3/08
代理公司：	北京乐知新创知识产权代理事务所(普通合伙) 11734	代理人：	刘婧
地址：	430223 湖北省武汉市东湖新技术***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	垃圾指令识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

公开了一种垃圾指令识别方法及装置。该方法应包括获取音频信息；将所述音频信息转换为文字信息；提取所述音频信息的音频特征生成音频特征集合；利用预训练的文本模型获取所述文本信息的特征向量；将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种垃圾指令识别方法及装置。

背景技术

目前，大部分智能设备都具备语音识别功能，且智能设备的语音识别状态有两种，一种是免唤醒状态，一种是唤醒状态。免唤醒状态与唤醒状态最大的不同在于，唤醒状态是用户先说唤醒词将智能设备唤醒，在智能设备被唤醒之后紧接着说出指令。智能设备在被唤醒之后接收到的用户语音即可以认为是有效的指令，从而直接进行指令内容的功能性识别(如查天气、播音乐等)。而智能设备在免唤醒的状态下，一次唤醒即可实现连续对话的状态，不需要每次对话的时候都说一次唤醒词，从而能够获得更好的用户体验。

但是在免唤醒状态下，需要智能设备能够识别接收到的音频是不是给它的指令，过滤掉无效干扰信息，再做出反应。因此，如何高质量的识别出接收到的音频是否为垃圾指令的问题亟待解决。

发明内容

为解决上述问题，本发明提供一种垃圾指令识别方法及装置，能够高质量的识别出接收到的音频是否为垃圾指令，从而提高智能设备在免唤醒状态下对音频识别的正确率，提升用户体验。

为了实现上述目的，在第一方面，本发明实施例提供了一种垃圾指令识别方法，该方法包括：

获取音频信息；

将所述音频信息转换为文字信息；

提取所述音频信息的音频特征生成音频特征集合；

利用预训练的文本模型获取所述文本信息的特征向量；

将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。

优选地，在所述获取音频信息之后，所述方法还包括：如果所述音频信息无法转换为文字信息，则确定所述音频信息为垃圾指令，并丢弃所述音频信息。

优选地，在所述将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令之后，所述方法还包括：如果所述音频信息不是垃圾指令，则对所述文本信息进行自然语言理解，并执行所述音频信息对应的动作；如果所述音频信息是垃圾指令，则丢弃所述音频信息。

优选地，所述将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令，包括：将所述音频特征集合和所述特征向量合成为一维特征，并将所述一维特征作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。