[发明专利]基于生成对抗网络的语音私密度掩蔽信号生成方法及系统有效

申请号：	202011450095.9	申请日：	2020-12-11
公开（公告）号：	CN112581929B	公开（公告）日：	2022-06-03
发明（设计）人：	李晔;冯涛;张鹏;李姝;汪付强	申请（专利权）人：	山东省计算中心（国家超级计算济南中心）
主分类号：	G10K11/175	分类号：	G10K11/175;G06N3/04;G06N3/08
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	黄海丽
地址：	250014 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于生成对抗网络语音密度掩蔽信号方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于生成对抗网络的语音私密度掩蔽信号生成方法，其特征是，包括：

生成随机噪声信号；

将随机噪声信号输入到训练后的生成对抗网络中，训练后的生成对抗网络的生成器，生成保护语音私密度的掩蔽信号，所述掩蔽信号为类语音信号；

所述训练后的生成对抗网络的训练步骤包括：

构建训练集；所述训练集为目标类语音库；

将随机噪声信号输入到生成器中，得到生成器生成的类语音信号；

将生成的类语音信号和目标类语音库中的类语音信号，同时输入到鉴别器中，鉴别器输出生成的类语音信号为目标类语音信号的概率，通过生成器与鉴别器的博弈，提升生成器生成的类语音信号逼近目标类语音信号的能力，最后得到训练后的生成对抗网络。

2.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法，其特征是，所述训练后的生成对抗网络的详细步骤包括：

对生成器进行初始化，得到初始化的生成器；

对鉴别器进行初始化，得到初始化的鉴别器；

对生成器与鉴别器的权值进行优化；

重复对生成器与鉴别器的权值进行优化步骤，判断是否达到设定迭代次数，如果达到，就停止训练，得到训练后的生成对抗网络；如果未达到，则继续训练；

对生成器进行初始化，得到初始化的生成器；具体步骤包括：

单独取出随机噪声，对所取出的随机噪声进行维度调整；

确定二维卷积卷积核尺寸、步长、填充方式，进行二维卷积后调整维度，对每一层的卷积结果使用激活函数；将二维卷积结果与尺寸大小相同的高斯噪声进行拼接；对拼接结果，进行二维反卷积，每个反卷积层的反卷积结果使用激活函数；

对最后一层输出值使用激活函数，得到生成的类语音信号；

对鉴别器进行初始化，得到初始化的鉴别器；具体步骤包括：

将目标类语音定义为初始w序列；

创建一个与初始w序列相同维度和相同尺寸的高斯噪声序列，并且将高斯噪声序列与初始w序列相加得到第一w序列；

调整第一w序列的维度；确定二维卷积层的卷积核尺寸、步长、填充方式，对第一w序列二维卷积并对卷积后生成的w序列进行虚拟批量标准化，对批量标准化的结果使用激活函数，经过十一次二维卷积得到第二w序列；

将第二w序列进行一维卷积随后送入全连接层，得到输出概率值为接近1的真数据的概率。

3.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法，其特征是，所述生成随机噪声信号步骤之后；所述将随机噪声信号输入到训练后的生成对抗网络中，训练后的生成对抗网络的生成器，生成保护语音私密度的掩蔽信号步骤之前，还包括：

对目标类语音信号进行预处理；

其中，所述对目标类语音信号进行预处理；具体包括：

对待目标类语音信号进行预加重处理；

对预加重处理后的待处理信号进行数据归一化处理。

4.如权利要求1所述的基于生成对抗网络的语音私密度掩蔽信号生成方法，其特征是，构建训练集；所述训练集为目标类语音库；具体步骤包括：

将THCHS30数据集中数据整合为tfrecords文件，文件中的目标类语音数据被标记成wav类；

确定生成对抗网络的优化器，同时将tfrecords文件目标类语音从tfrecords文件中读取出来；

改变目标类语音幅值大小，同时对其实施0.9～1范围内的预加重；

将目标类语音放入队列，每次取出所需的目标类语音与由程序生成的随机噪声。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东省计算中心（国家超级计算济南中心），未经山东省计算中心（国家超级计算济南中心）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011450095.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载