[发明专利]一种用于语音测谎的栈式去噪自编码器及深度神经网络结构有效
申请号: | 201910518672.4 | 申请日: | 2019-06-15 |
公开(公告)号: | CN110246509B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 方元博;陶华伟;傅洪亮;雷沛之;姜芃旭 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G10L19/012 | 分类号: | G10L19/012;G10L15/02;G10L25/30;G10L25/51;G06K9/62 |
代理公司: | 郑州科维专利代理有限公司 41102 | 代理人: | 赵继福 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 栈式去噪 编码器 深度 神经网络 结构 | ||
1.一种用于语音测谎的栈式去噪自编码及深度神经网络结构,其特征在于,包括:
(1)语音预处理装置:将录制好的语音按谎言和真话分类并标记上数字标签,去除音质较低的部分并剪切成每一条时长为2s左右的短语音,之后对其进行分帧及加窗,为下一步提取特征做准备;
(2)特征提取装置:对预处理完毕后的语音数据,提取出MFCC,过零率,基频等语音特征,并进行归一化以便分类;
(3)栈式去噪自编码器装置:该装置由多层加性噪声自编码器和一个softmax分类器组成,编码网络和解码网络各两层,第一个隐层的神经单元数为120,第二个隐层的神经单元数为30,除了连接各隐层的权重外,根据谎言语音的特点,在每一隐层都增加了非线性激活函数,批归一化,dropout三个部分,并且在编码网络的末端连接了一个softmax分类器;假设输入的数据为x,首先对原始特征x添加干扰信息,加入噪声得到特征为x′;
然后对特征进行编码:
h=σ(wx′+b)
接下来是解码:
z=σ(w′h+b′)
其中w、w′是权重矩阵,b、b′是偏置向量,σ是非线性激活函数;
去噪自编码器的目的是让误差函数η尽可能的小,以此得到表征性更好的特征;
栈式去噪自编码器就是多个去噪自编码器级联,以完成逐层特征提取的任务;
(4)深度神经网络装置:该装置由一层DNN网络组成,由装置(3)得到的特征输入到该装置中,通过softmax分类器对比测试集标签,进一步学习更深层次的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910518672.4/1.html,转载请声明来源钻瓜专利网。