[发明专利]基于轻量级深度学习的语音短指令识别方法及系统在审

申请号：	202111435113.0	申请日：	2021-11-29
公开（公告）号：	CN114141239A	公开（公告）日：	2022-03-04
发明（设计）人：	谢捷;朱明英;李琦靖;胡凯	申请（专利权）人：	江南大学
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/16;G10L15/04
代理公司：	苏州市中南伟业知识产权代理事务所(普通合伙) 32257	代理人：	张荣
地址：	214122 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于轻量级深度学习语音指令识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于轻量级深度学习模型的语音短指令识别方法及系统。本发明以手机实测的数据为基础，将连续短指令数据手动分段为短指令片段；其次根据分帧、加窗、短时傅里叶变换得到梅尔语谱图，使用梅尔滤波器、取对数后平方、离散余弦变换操作得到梅尔倒频谱系数特征；最后将梅尔语谱图和梅尔倒频谱系数作为特征，使用卷积神经网络进行分类识别。通过本发明的方法，不需要进行降噪等操作便可实现短指令的自动识别。

技术领域

本发明涉及语音信号识别技术领域，尤其是指基于轻量级深度学习的语音短指令识别方法及系统。

背景技术

作为语音识别的分支，语音短指令识别被应用到众多领域中，例如机器人控制、智能汽车、智能家居等等。其中，智能家居更有效地为人们服务，因为用户可以基于物联网技术直接使用自然语言实现对家用设备控制，提升了用户的居住体验。

在语音短指令识别中，传统的机器学习的方法通常包括三个步骤：①由降噪和语音活动检测两部分组成的预处理过程；②经过特征提取过程找到一个特征集代表语音短指令特征提取；③使用机器学习算法对语音短指令进行分类。但是，这种传统机器学习方法对于短指令的分类效果高度依赖于特征提取集的好坏，而特征提取方法又通常会对特征类型做一定的限制，并且因为机器学习需要人工提取特征，所以只有专业人员来参与完成特征提取过程模型才能得到较好的分类效果。

综上所述，传统的机器学习方法需要手工设计特征，其识别准确率较低、灵活性弱。

发明内容

为此，本发明所要解决的技术问题在于克服现有技术中传统的机器学习方法需要手工设计特征所导致的识别准确率较低、灵活性弱的问题。

为解决上述技术问题，本发明提供了基于轻量级深度学习的语音短指令识别方法，包括如下步骤：

步骤S1：采集连续不同的短指令数据并进行预处理，得到采样率一致的短指令数据；

步骤S2：对采样率一致的短指令数据进行分段，得到多条短指令片段；

步骤S3：根据多条短指令片段得到每条短指令片段的语谱图，根据语谱图得到梅尔语谱图，根据梅尔语谱图得到梅尔倒频谱系数；

步骤S4：将梅尔语谱图与梅尔倒频谱系数分别作为卷积神经网络模型的输入并进行训练，得到利用梅尔语谱图作为输入训练得到的第一模型、与利用梅尔倒频谱系数作为输入训练得到的第二模型，并选取第一模型、第二模型中识别准确率较高的模型进行语音短指令识别。

在本发明的一个实施例中，步骤S1中，所述采集连续不同的短指令数据并进行预处理，得到采样率一致的短指令数据的方法为：对连续不同的短指令数据转换为统一格式，并通过Audacity软件更改为统一的采样率数值。

在本发明的一个实施例中，步骤S2中，所述对采样率一致的短指令数据进行分段，得到多条短指令片段的方法为：

步骤S21、通过人耳对采样率一致的短指令数据进行短指令片段选择；

步骤S22、记录每条短指令片段选区的起始和终止采样点数据；