[发明专利]基于生成对抗网络的语音私密度掩蔽信号生成方法及系统有效
申请号: | 202011450095.9 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112581929B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 李晔;冯涛;张鹏;李姝;汪付强 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G10K11/175 | 分类号: | G10K11/175;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 语音 密度 掩蔽 信号 方法 系统 | ||
1.基于生成对抗网络的语音私密度掩蔽信号生成方法,其特征是,包括:
生成随机噪声信号;
将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号,所述掩蔽信号为类语音信号;
所述训练后的生成对抗网络的训练步骤包括:
构建训练集;所述训练集为目标类语音库;
将随机噪声信号输入到生成器中,得到生成器生成的类语音信号;
将生成的类语音信号和目标类语音库中的类语音信号,同时输入到鉴别器中,鉴别器输出生成的类语音信号为目标类语音信号的概率,通过生成器与鉴别器的博弈,提升生成器生成的类语音信号逼近目标类语音信号的能力,最后得到训练后的生成对抗网络。
2.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法,其特征是,所述训练后的生成对抗网络的详细步骤包括:
对生成器进行初始化,得到初始化的生成器;
对鉴别器进行初始化,得到初始化的鉴别器;
对生成器与鉴别器的权值进行优化;
重复对生成器与鉴别器的权值进行优化步骤,判断是否达到设定迭代次数,如果达到,就停止训练,得到训练后的生成对抗网络;如果未达到,则继续训练;
对生成器进行初始化,得到初始化的生成器;具体步骤包括:
单独取出随机噪声,对所取出的随机噪声进行维度调整;
确定二维卷积卷积核尺寸、步长、填充方式,进行二维卷积后调整维度,对每一层的卷积结果使用激活函数;将二维卷积结果与尺寸大小相同的高斯噪声进行拼接;对拼接结果,进行二维反卷积,每个反卷积层的反卷积结果使用激活函数;
对最后一层输出值使用激活函数,得到生成的类语音信号;
对鉴别器进行初始化,得到初始化的鉴别器;具体步骤包括:
将目标类语音定义为初始w序列;
创建一个与初始w序列相同维度和相同尺寸的高斯噪声序列,并且将高斯噪声序列与初始w序列相加得到第一w序列;
调整第一w序列的维度;确定二维卷积层的卷积核尺寸、步长、填充方式,对第一w序列二维卷积并对卷积后生成的w序列进行虚拟批量标准化,对批量标准化的结果使用激活函数,经过十一次二维卷积得到第二w序列;
将第二w序列进行一维卷积随后送入全连接层,得到输出概率值为接近1的真数据的概率。
3.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法,其特征是,所述生成随机噪声信号步骤之后;所述将随机噪声信号输入到训练后的生成对抗网络中,训练后的生成对抗网络的生成器,生成保护语音私密度的掩蔽信号步骤之前,还包括:
对目标类语音信号进行预处理;
其中,所述对目标类语音信号进行预处理;具体包括:
对待目标类语音信号进行预加重处理;
对预加重处理后的待处理信号进行数据归一化处理。
4.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法,其特征是,构建训练集;所述训练集为目标类语音库;具体步骤包括:
将THCHS30数据集中数据整合为tfrecords文件,文件中的目标类语音数据被标记成wav类;
确定生成对抗网络的优化器,同时将tfrecords文件目标类语音从tfrecords文件中读取出来;
改变目标类语音幅值大小,同时对其实施0.9~1范围内的预加重;
将目标类语音放入队列,每次取出所需的目标类语音与由程序生成的随机噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011450095.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型飞锯机
- 下一篇:一种自主辅助驱动的平稳爬楼装置