[发明专利]一种基于自编码网络联合学习的语音测谎方法在审
申请号: | 202011433508.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112562645A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 刘曼;庄志豪;傅洪亮;陶华伟 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/21;G10L25/24;G10L25/30;G10L25/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 网络 联合 学习 语音 方法 | ||
1.一种基于自编码网络联合学习的语音测谎方法,其特征在于,包括以下步骤:
(1)语音信号预处理:在语音处理预处理阶段先给语音添加上真话与谎言的标签,然后再对语音进行分帧加窗等处理;
(2)语音特征提取:对(1)中经分帧加窗处理后的数据进行语音特征提取,该特征包括但不限于基频、短时平均能量、短时平均过零率、均方根能量、共振峰、MFCC等声学特征;
(3)搭建网络模型:首先该网络由两个自编码网络以及批归一化层、Dropout层和分类层,该过程的具体实现步骤如下:
A.首先,将(2)中提取的语音特征作为输入发送到一个自编码网络,同时,将经加噪处理后作为另一个自编码网络的输入,两个自编码网络同时进行学习,共同完成训练过程,这两个自编码网络均以原始的输入数据为目标进行学习,这一过程实现了对原始数据的重构,通过对最小化解码后的数据与输入数据之间误差函数,完成学习过程,其中,编码过程可以用以下公式来表示:
x1=x (1)
y1=f(wx1+b) (2)
y1k=elu(wk-1·y1k-1+bk-1)2≤k≤K (3)
x2=x+xnoise (4)
y2=f(wx2+b) (5)
y2k=elu(wk-1·y2k-1+bk-1)2≤k≤K (6)
其中x所代表的是一个自编码网络的输入,而y1、y2分别为编码网络的输出;
B.本发明中在数据进行编码之后,再以原始数据为目标进行数据的重构,该过程的实现过程可以表示为:
x1'=f(wy1+b) (7)
(x1')k=elu(wDk-1·(x1')k-1+bDk-1)2≤k≤K-1 (8)
x2'=f(wy2+b) (9)
(x2')k=elu(wDk-1·(x2')k-1+bDk-1)2≤k≤K-1 (10)
C.计算两个自编码网络的数据重构误差,损失函数分别为公式(11)、(12),两个自编码网络无监督部分的总损失为公式(13):
Lu=Lu1+Lu2 (13)
(4)将两个自编码网络的编码输出进行深层融合,该过程保留语音中的更多信息;
(5)将融合后的特征输入到全连接层,作为分类器的输入,该过程通过设置Dropout层,一直网络的过拟合,然后将该输出结果进行分类识别,计算该有监督过程的损失计算选择交叉熵损失函数,实现过程如下:
(6)分类识别输出:将步骤(4)得到的融合后的特征送入全连接层,并采用有标签的数据通过softmax层进行识别分类,该过程可以表示为:
ypre=f(W·c+b) (15)
其中,c是两个分支通过编码后进行融合的数据集合,ypre是融合后数据经分类器后的分类结果,W,b分别是编码网络与分类器间的权重和偏置;
(7)为优化该发明提出的方法,采用梯度下降法来最小化误差函数(重构误差与分类误差),并根据误差函数进行网络参数的调整,以使该发明所提出的语音测谎方法性能达到最佳。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011433508.2/1.html,转载请声明来源钻瓜专利网。