[发明专利]一种基于PSO算法的语音识别攻击防御方法有效
申请号: | 201910851698.0 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110767216B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 陈晋音;郑喆 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/20;H04L9/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于PSO算法的语音识别攻击防御方法,包括:(1)准备原始音频数据集,分成预训练数据集、测试数据集和用于生成对抗样本的扰动数据集;(2)训练语音识别模型:搭建语音识别模型并初始化模型的相关参数,利用预训练数据集对语音识别模型进行训练,并使用测试数据集测试模型的识别准确率;(3)攻击语音识别模型:搭建基于PSO算法的攻击方法,设置适应度函数及PSO算法的相关参数,利用该攻击方法生成的最优对抗样本能够被错误识别且不被人耳识别;(4)对抗训练语音识别模型:将步骤(3)中生成的对抗样本加入预训练数据集中,重新训练语音识别模型,使得语音识别模型具有防御对抗样本攻击的能力,提高模型的安全性和稳定性。 | ||
搜索关键词: | 一种 基于 pso 算法 语音 识别 攻击 防御 方法 | ||
【主权项】:
1.一种基于PSO算法的语音识别攻击防御方法,包括以下步骤:/n(1)准备原始音频数据集:采集多种不同场景下的多种类音频并进行预处理,分成预训练数据集、测试数据集和用于生成对抗样本的扰动数据集,其具体过程如下:/nStep11:采集多种场景下的多种类音频,包括人说话的声音、音乐声真实生活场景中的声音,其中人说话的内容包括文章朗读片段、各种指示指令等,音频采集环境包含安静环境和嘈杂环境,嘈杂环境中有汽车鸣笛声、音乐声、人说话声音的干扰,干扰的影响有限,能够使人类清晰识别出说话者的说话内容;/nStep12:将上述采集的音频进行裁剪并处理成数据流格式的音频文件,对每个音频都添加相应的标签;/nStep13:将预处理后的音频分成预训练数据集、测试数据集和用于生成对抗样本的扰动数据集;/n(2)训练语音识别模型:搭建语音识别模型并初始化模型的相关参数,利用预训练数据集对语音识别模型进行训练,并使用测试数据集测试模型的识别准确率,若模型不能达到预设的准确率,则调整语音识别模型的参数重新训练测试,直到模型达到预设的识别准确率;/n(3)攻击语音识别模型:搭建基于PSO算法的攻击方法,设置适应度函数及PSO算法的相关参数,利用该攻击方法生成的最优对抗样本能够被错误识别且不被人耳识别;攻击语音识别模型的具体过程如下:/nStep31:初始化适应度函数,定义适应度函数如下;/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910851698.0/,转载请声明来源钻瓜专利网。