[发明专利]一种用于语音测谎的栈式去噪自编码器及深度神经网络结构有效
申请号: | 201910518672.4 | 申请日: | 2019-06-15 |
公开(公告)号: | CN110246509B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 方元博;陶华伟;傅洪亮;雷沛之;姜芃旭 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G10L19/012 | 分类号: | G10L19/012;G10L15/02;G10L25/30;G10L25/51;G06K9/62 |
代理公司: | 郑州科维专利代理有限公司 41102 | 代理人: | 赵继福 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 现有的语音谎言检测算法常采用的特征是组合特征,特征冗余较大,针对这一问题,本发明公布了一种面向语音谎言检测的栈式去噪自编码及深度神经网络(SDAE‑DNN)结构。它包含有两层的编码和解码网络以及后接DNN网络。该结构首先使用两层去噪自编码结构降低特征的冗余,其中为了防止过拟合,在栈式去噪自编码器的每一个网络层都增加了dropout,然后采用一层DNN网络进一步学习特征,最后使用softmax分类器对网络进行微调,得到了更加具有表征性的特征,从而提升网络对于谎言的识别效果。 | ||
搜索关键词: | 一种 用于 语音 栈式去噪 编码器 深度 神经网络 结构 | ||
【主权项】:
1.本发明公布了一种用于语音测谎的栈式去噪自编码及深度神经网络结构,其特征在于,包括以下步骤:(1)语音预处理:将录制好的语音按谎言和真话分类并标记上数字标签,去除音质较低的部分并剪切成每一条时长为2s左右的短语音,之后对其进行分帧及加窗,为下一步提取特征做准备;(2)特征提取:对预处理完毕后的语音数据,提取出MFCC,过零率,基频等语音特征,并进行归一化以便分类;(3)栈式去噪自编码器装置:该装置由多层加性噪声自编码器和一个softmax分类器组成;编码网络和解码网络各两层,第一个隐层的神经单元数为120,第二个隐层的神经单元数为30,除了连接各隐层的权重外,根据谎言语音的特点,我们在每一隐层都增加了Elu激活函数,批归一化,dropout三个部分,并且在编码网络的末端连接了一个softmax分类器;假设输入的数据为x,首先对原始特征x添加干扰信息,如加入噪声或者类似dropout算法以一定概率擦除某些数据,得到特征为x′;然后对特征进行编码:h=σ(wx′+b)接下来是解码:z=σ(w′h+b′)其中w、w′是权重矩阵,b、b′是偏置向量,σ是非线性激活函数;去噪自编码器的目的是让误差函数η尽可能的小,以此得到表征性更好的特征;栈式去噪自编码器就是多个去噪自编码器级联,以完成逐层特征提取的任务;(4)深度神经网络装置:该装置由一层DNN网络组成,由装置(3)得到的特征输入到该装置中,通过softmax分类器对比测试集标签,进一步学习更深层次的特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910518672.4/,转载请声明来源钻瓜专利网。