[发明专利]一种基于注意力卷积自编码器的推荐系统攻击检测方法在审
申请号: | 201911094684.5 | 申请日: | 2019-11-11 |
公开(公告)号: | CN110826056A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 费艳;刘欣雨;缪骞云 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06N3/04;G06N3/08 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 朱少华 |
地址: | 210009 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 卷积 编码器 推荐 系统 攻击 检测 方法 | ||
1.一种基于注意力卷积自编码器的推荐系统攻击检测方法,其特征在于:
步骤一:首先获取数据集,对数据集进行预处理并获得训练数据集;
步骤二:根据步骤一获得的训练数据集,输入卷积自编码器模型,得到高维特征表示矩阵;
步骤三:根据步骤二获得的高维特征表示矩阵,得到项目注意力矩阵,结合项目注意力矩阵以及步骤二得到的高维特征表示矩阵得到最终的特征矩阵;
步骤四:最后将得到的最终特征矩阵输入全连接层分类,利用准确率、召回率、F值作为算法的性能评价指标。
2.根据权利要求1所述的基于注意力卷积自编码器的推荐系统攻击检测方法,其特征在于,步骤一中所述的数据集获得以及数据预处理包括以下步骤:
步骤一:首先获取数据集,向数据集分别注入三种类型的攻击:均值攻击,流行攻击以及随机攻击;
步骤二:对填充好的数据集按照规则进行分类,将相同类别的数据分到相同的簇集;
步骤三:将数据按3:1划分为训练集和测试集,并分为不同的批次送入模型并进行训练。
3.根据权利要求1所述的基于注意力卷积自编码器的推荐系统攻击检测方法,其特征在于,步骤二中所述的得到用户高维特征表示矩阵包括以下步骤:
步骤一:首先构造深度卷积自编码器神经网络模型,利用数据集中原始的用户useri对项目itemj的评分rij构造评分矩阵作为输入,假设输入大小为(H,W),卷积核大小为(FH,FW),输出大小为(OH,OW),填充为P,步幅为S,则输出大小可表示为:
进入自动编码器的编码部分第一层卷积层做卷积操作提取特征:
其中,表示第l层第n个特征图以及第l-1层第m个特征图,为到的卷积核,本文选取卷积核尺寸为3×3,是偏置项,是一个实数,*符号代表了卷积操作,f是激活函数;第一层卷积层的输出进入激活函数层;编码部分为3层卷积层以及2层激励函数层的叠加,数据经过最后一层卷积层的作用后,自动编码器数据提取的编码部分就结束;
步骤二:数据经过编码特征提取后,输入解码器反卷积解码操作,第一层反卷积过程可表示为:
其中,表示第l层第m个特征图以及第l-1层第n个特征图,为到的卷积核,这里选取卷积核尺寸同样为3×3,是偏置项,是一个实数,*符号代表了卷积操作,f是激活函数;数据经过最后一层反卷积的作用后,自动编码器数据提取的解码部分就结束,得到用户的高维特征表示矩阵R。
4.根据权利要求1所述的基于注意力卷积自编码器的推荐系统攻击检测方法,其特征在于步骤三中得到最终的特征矩阵包括以下步骤:
步骤一:分析不同的项目对整个任务结果的影响程度,基于上述得到的用户高维特征表示矩阵R,设R为w×v的矩阵,即(w行v列),第a行b列的元素是r(a,b),即:R=r(a,b),则R的转置矩阵为v×w阶矩阵R′,满足r′(b,a)=r(a,b),则称R′为R的转置矩阵,得到R′;
步骤二:根据R′,R,项目注意力矩阵att可表示为:
att=R﹒R′
其中,﹒符号表示点乘,att表示注意力矩阵,R表示用户的高维特征表示矩阵,R′为R的转置矩阵;
步骤三:最终的特征矩阵Q可表示为:
Q=att﹒R。
5.根据权利要求1所述的基于注意力卷积自编码器的推荐系统攻击检测方法,其特征在于步骤四中生成分类结果并评价包括以下步骤:
步骤一:基于上述得到的特征矩阵Q,使用reshape()函数将多维的张量展开成一维向量,并映射到样本标记空间得到每一位用户的分类概率,后续再通过分类函数得到用户具体的类别,完成用户的分类;
步骤二:通过反向传播算法(Back propagation)优化模型,更新权重,本文选用交叉熵损失函数CrossEntropyLossAdam:
其中x表示输入,q(x)表示预测值,m(x)表示真实值,便于我们使用梯度下降的方法找到最优解;本文的优化算法采用了自适应动量项(adaptive moments,Adam)算法,Adam优化器正则化权重,防止过拟合,同时更新神经网络参数;真实标签为li,若则预测正确,反之,则预测错误;
步骤三:使用评价指标准确率(Precision)、召回率(Recall)、F值(F-measure)对检测结果进行评估,计算方式分别如下:
其中,TP(真正)表示将正类预测为正类数,FP(假正)表示将负类预测为正类数,FN(假负)表示将正类预测为负类数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911094684.5/1.html,转载请声明来源钻瓜专利网。