[发明专利]一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质有效
申请号: | 202010342065.X | 申请日: | 2020-04-24 |
公开(公告)号: | CN111522953B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 顾钊铨;朱斌;谢禹舜;伍丹妮;仇晶;韩伟红;方滨兴 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 朴素 贝叶斯 分类 边际 攻击 方法 装置 存储 介质 | ||
1.一种针对朴素贝叶斯分类器的边际攻击方法,其特征在于,步骤包括:
将文本输入文本分类器,对所述文本进行预处理;对预处理后的文本进行特征提取;具体地,对预处理后的文本提取词汇表Vocab[w1,w2,…,wh],利用词汇表Vocab,统计所有词汇在不同类别中出现的频率fhi,h表示词汇的维度,i表示当前频率所对应的类别;并利用朴素贝叶斯算法进行文本分类;
获取文本分类器的文本类别,并且计算两个所述文本类别之间的频率比,具体为:
通过以下方式计算从文本分类器获得的两个文本类别在同一维度上的频率比:
其中,i,j为两个不同文本类别;分别为两个文本类别i,j在同一维度hk上的频率;
以所述频率比作为索引,对词汇表进行排序,得到敏感词集;
随机选取若干个敏感词添加到原始样本,得到对抗样本;
将所述对抗样本输入到文本分类器,得到错误分类的文本类别。
2.如权利要求1所述的针对朴素贝叶斯分类器的边际攻击方法,其特征在于,所述随机选取若干个敏感词添加到原始样本,得到对抗样本,具体为:
对任意一文本进行包括分词、去除停用词的处理后,得到样本X=[x1,x2,…,xm],m表示样本X的词汇数目;
随机选取若干个敏感词添加到样本X末尾,得到了对抗样本X’=[x1,x2,…,xm,wr,ws,…]。
3.如权利要求1所述的针对朴素贝叶斯分类器的边际攻击方法,其特征在于,还包括对分类结果进行验证,具体如下:
所述对抗样本输入到文本分类器后,得到所述对抗样本的对应各文本类别的分类概率;
选取最大分类概率对应的文本类别作为错误分类类别,比较错误分类类别与原始文本的最大分类概率对应的文本类别;若对比结果为不一致,则文本分类器出现错误分类。
4.一种针对朴素贝叶斯分类器的边际攻击装置,其特征在于,包括:
计算模块,用于将文本输入文本分类器,对所述文本进行预处理;对预处理后的文本进行特征提取;具体地,对预处理后的文本提取词汇表Vocab[w1,w2,…,wh],利用词汇表Vocab,统计所有词汇在不同类别中出现的频率fhi,h表示词汇的维度,i表示当前频率所对应的类别;并利用朴素贝叶斯算法进行文本分类;获取文本分类器的文本类别,并且计算两个所述文本类别之间的频率比;
排序模块,用于以所述频率比作为索引,对词汇表进行排序,得到敏感词集,具体为:
通过以下方式计算从文本分类器获得的两个文本类别在同一维度上的频率比:
其中,i,j为两个不同文本类别;分别为两个文本类别i,j在同一维度hk上的频率;
生成模块,用于随机选取若干个敏感词添加到原始样本,得到对抗样本;
输出模块,用于将所述对抗样本输入到文本分类器,得到错误分类的文本类别。
5.如权利要求4所述的针对朴素贝叶斯分类器的边际攻击装置,其特征在于,所述生成模块还用于:
对任意一文本进行包括分词、去除停用词的处理后,得到样本X=[x1,x2,…,xm],m表示样本X的词汇数目;
随机选取若干个敏感词添加到样本X末尾,得到了对抗样本X’=[x1,x2,…,xm,wr,ws,…]。
6.如权利要求4所述的针对朴素贝叶斯分类器的边际攻击装置,其特征在于,还包括验证模块,所述验证模块用于:
所述对抗样本输入到文本分类器后,得到所述对抗样本的对应各文本类别的分类概率;选取最大分类概率对应的文本类别作为错误分类类别,比较错误分类类别与原始文本的最大分类概率对应的文本类别;若对比结果为不一致,则文本分类器出现错误分类。
7.一种针对朴素贝叶斯分类器的边际攻击装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的针对朴素贝叶斯分类器的边际攻击方法。
8.一种针对朴素贝叶斯分类器的边际攻击方法的存储介质,其特征在于,所述针对朴素贝叶斯分类器的边际攻击方法的存储介质用于存储一个或多个计算机程序,所述一个或多个计算机程序包括程序代码,当所述计算机程序在计算机上运行时,所述程序代码用于执行上述权利要求1至3任一项所述的针对朴素贝叶斯分类器的边际攻击方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010342065.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种透气利水立体贴身护垫
- 下一篇:残留气体去除设备和方法