[发明专利]一种面向文本分类模型的字词双粒度对抗防御系统及方法有效
申请号: | 202111219436.6 | 申请日: | 2021-10-20 |
公开(公告)号: | CN114091568B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 关志涛;董伙元;董珈良 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/2321;G06F16/35;G06N3/045;G06N3/08 |
代理公司: | 南京中律知识产权代理事务所(普通合伙) 32341 | 代理人: | 李建芳 |
地址: | 102206 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 文本 分类 模型 字词 粒度 对抗 防御 系统 方法 | ||
1.一种面向文本分类模型的字词双粒度对抗防御系统,其特征在于,包括:
SVM分类器训练与预处理模块,该模块用于构造一个二分类的SVM分类模型,并基于SVM分类模型对本系统的输入文本进行预处理;
字符级防御模型模块,该模块实现对字符级攻击粒度的文本数据进行正确文本分类;
词汇级防御模型模块,该模块实现对词汇级攻击粒度的文本数据进行正确文本分类;
辅助信息模块,该辅助模块包括了分类正确率可视化、模型分类正确率对比、数据集信息展示、模型信息展示和导出预测结果组成部分,用于系统分类结果展示、性能评估和功能拓展。
2.根据权利要求1所述的面向文本分类模型的字词双粒度对抗防御系统,其特征在于,SVM分类器训练与预处理模块包括SVM分类模型原始语料的训练和基于该模型对系统输入数据的预处理;其中,预处理包括通过错次数和样本长度指标对抗样本攻击粒度分类。
3.根据权利要求1或2所述的面向文本分类模型的字词双粒度对抗防御系统,其特征在于,字符级防御模型模块包含对字符级对抗样本进行鲁棒编码和聚类分析。
4.根据权利要求3所述的面向文本分类模型的字词双粒度对抗防御系统,其特征在于,鲁棒编码和聚类分析的具体过程为:
字符级防御模型通过聚类方法对原始样本单词进行映射,所有的拼写错误会与原单词划分到同一簇中;因此,有如下定义:是V维向量空间R|V|中根据单词wi生成的一个向量,作为单词的词嵌入,定义编码的令牌与不包含单词wi的聚类Cj中的单词有如下关系:
其中,p(wi)为单词wi被编码的频率;设C(i)为单词wi的聚类索引,定义保真度目标Fid为:
当高频词和罕见词在同一簇中时,Fid为高;当多个高频词在同一簇中时,Fid为低;
对稳定性而言,稳定性度量单词的拼写映射到不同编码标记的程度;因此,定义一组可以映射出拼写错误的单词wi的标记Bπ(wi):
其中,B(wi)是wi允许的打字错误集;表示B(wi)中除wi外的单词;表示可以映射出拼写错误的单词wi的单词集合;使用编码频率p(wi)在聚类C上定义标准化频率Stab,聚类C的标准化频率如下:
引入一个超参数γ∈[0,1]来平衡泛化性和稳定性,近似最小化Stab和Fid的加权组合:
ψ(C)=γFid(C)+(1-γ)Stab(C)。
5.根据权利要求1或2所述的面向文本分类模型的字词双粒度对抗防御系统,其特征在于,词汇级防御模型模块通过PWWS方法生成对抗样本,进行对抗训练,最终得到鲁棒的对抗防御模型。
6.根据权利要求5所述的面向文本分类模型的字词双粒度对抗防御系统,其特征在于,对抗训练过程中的训练样本由原始样本和基于PWWS方法生成的对抗样本按1:1比例生成。
7.一种面向文本分类模型的字词双粒度对抗防御方法,其特征在于,包括如下步骤:
1)首先通过大量原始样本和对抗样本训练,得到基于SVM的机器学习SVM分类模型;训练得到的SVM分类模型对输入的文本数据进行预处理,通过错词数和样本长度进行对抗样本攻击粒度分类,并分为字符级对抗样本和词汇级对抗样本两类;
2)对于字符级对抗样本,引入Robust Encodings防御方法,对不同数据做相同的映射,设计字符级防御模型;
3)对于词汇级对抗样本,在PWWS攻击方法的基础上通过单词级防御算法设计词汇级防御模型;
4)将字符级防御模型和词汇级防御模型集成封装成一个独立可调用的综合对抗防御系统,并添加了模型信息展示、数据集信息展示和效果评估辅助功能板块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111219436.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高速水果自动套袋装置
- 下一篇:融合成分注意力的非自回归机器翻译方法