[发明专利]一种用于语音测谎的栈式去噪自编码器及深度神经网络结构有效

申请号：	201910518672.4	申请日：	2019-06-15
公开（公告）号：	CN110246509B	公开（公告）日：	2021-07-13
发明（设计）人：	方元博;陶华伟;傅洪亮;雷沛之;姜芃旭	申请（专利权）人：	河南工业大学
主分类号：	G10L19/012	分类号：	G10L19/012;G10L15/02;G10L25/30;G10L25/51;G06K9/62
代理公司：	郑州科维专利代理有限公司 41102	代理人：	赵继福
地址：	450001 河南省郑州市高新技***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：	现有的语音谎言检测算法常采用的特征是组合特征，特征冗余较大，针对这一问题，本发明公布了一种面向语音谎言检测的栈式去噪自编码及深度神经网络（SDAE‑DNN）结构。它包含有两层的编码和解码网络以及后接DNN网络。该结构首先使用两层去噪自编码结构降低特征的冗余，其中为了防止过拟合，在栈式去噪自编码器的每一个网络层都增加了dropout，然后采用一层DNN网络进一步学习特征，最后使用softmax分类器对网络进行微调，得到了更加具有表征性的特征，从而提升网络对于谎言的识别效果。
搜索关键词：	一种用于语音栈式去噪编码器深度神经网络结构
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.本发明公布了一种用于语音测谎的栈式去噪自编码及深度神经网络结构，其特征在于,包括以下步骤：(1)语音预处理：将录制好的语音按谎言和真话分类并标记上数字标签，去除音质较低的部分并剪切成每一条时长为2s左右的短语音，之后对其进行分帧及加窗，为下一步提取特征做准备；(2)特征提取：对预处理完毕后的语音数据，提取出MFCC，过零率，基频等语音特征，并进行归一化以便分类；(3)栈式去噪自编码器装置：该装置由多层加性噪声自编码器和一个softmax分类器组成；编码网络和解码网络各两层，第一个隐层的神经单元数为120，第二个隐层的神经单元数为30，除了连接各隐层的权重外，根据谎言语音的特点，我们在每一隐层都增加了Elu激活函数，批归一化，dropout三个部分，并且在编码网络的末端连接了一个softmax分类器；假设输入的数据为x，首先对原始特征x添加干扰信息，如加入噪声或者类似dropout算法以一定概率擦除某些数据，得到特征为x′；然后对特征进行编码：h＝σ(wx′+b)接下来是解码：z＝σ(w′h+b′)其中w、w′是权重矩阵，b、b′是偏置向量，σ是非线性激活函数；去噪自编码器的目的是让误差函数η尽可能的小，以此得到表征性更好的特征；栈式去噪自编码器就是多个去噪自编码器级联，以完成逐层特征提取的任务；(4)深度神经网络装置：该装置由一层DNN网络组成，由装置(3)得到的特征输入到该装置中，通过softmax分类器对比测试集标签，进一步学习更深层次的特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河南工业大学，未经河南工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910518672.4/，转载请声明来源钻瓜专利网。

上一篇：一种信号调制方法、装置和存储介质
下一篇：一种基于RefineNet的端到端语音增强方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于语音测谎的栈式去噪自编码器及深度神经网络结构有效

专利文献下载