[发明专利]一种网络安全应急响应知识图谱实体对齐方法有效
申请号: | 202210184898.7 | 申请日: | 2022-02-28 |
公开(公告)号: | CN114254131B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 车洵;孙捷;梁小川;胡牧;金奎;徐达;刘志顺 | 申请(专利权)人: | 南京众智维信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/189;G06F40/216;G06K9/62;G06N5/04;G06N3/04 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 张苏沛 |
地址: | 211300 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络安全 应急 响应 知识 图谱 实体 对齐 方法 | ||
1.一种网络安全应急响应知识图谱实体对齐方法,其特征在于,包括以下步骤:
S1:将知识图谱输入到基于PARIS模型的PR模块进行计算,输出安全事件实体映射集及其相对应的等价概率;
S2:在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体映射作为对齐种子,输入基于嵌入的MultiKE模型的SE模块进行训练;
S3:训练完成后,SE模块在尚未被PR模块对齐的安全事件实体集上进行测试,输出安全事件实体嵌入以及通过邻近检索算法得到的安全事件实体映射集及其相对应的每个映射的相似度得分;
S4:将S3获得的安全事件实体映射集和安全事件实体嵌入作为输入反馈给PR模块进行下一轮计算;
S5:经过K次迭代,PR模块输出最终的安全事件实体映射集;
步骤S1:将知识图谱输入到基于PARIS模型的PR模块进行计算,输出安全事件实体映射集及其相对应的等价概率包括以下步骤:
S101:将两个网络安全知识图谱G和G’输入;
S102:在PR模块进行初始化,k=0时,将知识图谱的关系三元组以函数的形式表达,PR模块计算每个关系函数作为函数的严谨性,其公式为:
其中F(r)表示将关系r作为函数,即头实体指向唯一尾实体的严谨性的计算,F-1(r)表示将r的逆关系作为函数,即尾实体指向唯一头实体的严谨性的计算,|{(h,t)|(h,r,t)∈T+}|表示关系三元组与属性三元组的集合中具有r关系的实体对个数,|{h|(h,r,t)∈T+}|表示集合中具有r关系的头实体个数,|{t|(h,r,t)∈T+}|表示集合中具有r关系的尾实体个数;
S103:PR模块交替计算知识图谱中安全事件实体等价概率和关系之间的包容关系概率,两个实体h和h’之间等价的概率记为P(h≡h′),由以下公式进行计算:
S104:r是r’的一个子关系的概率记为并初始化为0.1,其计算公式为:
S105:PR模块通过自迭代进行优化直至收敛;
S106:生成由PR模块得到的安全事件实体映射集合和未对齐的安全事件实体集
步骤S2:在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体映射作为对齐种子,输入基于嵌入的MultiKE模型的SE模块进行训练包括以下步骤:
S201:进行K次循环迭代;
S202:在第一次迭代中,k=1,通过设置阈值δ2,从上一次迭代中PR模块输出的安全事件实体映射集合选出该集合中实体等价概率的映射作为对齐种子,记为Sk,其中δ2∈[0,1);
S203:将对齐种子Sk作为SE模块的输入进行训练;
S204:使用TransE模型,通过收敛以下的损失函数来学习对齐种子中实体与关系之间的向量表示,其损失函数的公式为:
其中||·||表示欧几里德范数运算,中间的h,r,t分别表示h,r,t的m维嵌入;
S205:用以下分数函数来测量关系事实h,r,t的关系嵌入的合理性:
frel(h,r,t)=||h+r-t||
其中frel(·)表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数;
S206:计算对齐种子中关系事实h,r,t真实存在的概率,公式为:
Prel(ζ(h,r,t)=1|Θ(1))=sigmid(frel(h,r,t))
其中Θ(1)指关系视图中的嵌入,ζ(h,r,t)=1表示(h,r,t)真实存在的标签;
S207:通过收敛以下的损失函数来学习关系视图中的嵌入Θ(1):
其中χ+为对齐种子中的真实关系事实集,而x-表示通过将真实关系的头实体或者尾实体替换为随机实体后进行采样的伪造事实集,Θ(1)指关系视图中的嵌入,表示关系视图的逻辑损失函数,frel(·)表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数,ζ(h,r,t)表示(h,r,t)的标签;
S208:将属性嵌入及对应的属性值拼接成矩阵,送至卷积核为2xc的CNN进行计算,以得到其压缩表示,并将得到的特征张量重塑为一个向量形式送入参数为W的全连接层,该过程用以下公式表示:
CNN(a;v)=σ(vec(σ(a;v*Ω)))
其中CNN(·)表示卷积操作以得到属性嵌入及对应的属性值拼接成的矩阵的压缩表示,a;v即为属性嵌入a与其对应的属性值拼接而成的矩阵,vec(·)将特征映射张量重塑为向量,Ω是一个2xc的卷积核,σ(·)是一个激活函数;
S209:用以下分数函数来测量属性事实h,a,v的嵌入合理性:
fattr(h,r,t(=)=-||h-CNN(a;v)||
其中fattr(·)表示在属性视图下测量属性事实h,a,v嵌入的合理性的分数函数;
S210:通过收敛以下的损失函数来学习属性视图中的嵌入Θ(2):
其中Θ(2)指属性视图中的嵌入,表示属性视图的逻辑损失函数,fattr(·)表示在属性视图下测量属性事实h,a,v嵌入的合理性的分数函数,γ+为对齐种子中的真实属性事实集;
S211:进行SE模块的第一次自迭代优化;
S212:采用组合嵌入策略,该组合参与了多视图嵌入的联合训练,能统一嵌入空间中的组合嵌入和视图特定嵌入之间的一致性,其损失函数如下:
其中表示多视图嵌入的联合训练的损失函数,为对齐种子中所有安全事件实体组合嵌入矩阵,每一行代表一个安全事件实体,H(i)为第i个视图的安全事件实体嵌入矩阵,||·||F表示F范数;
S213:在关系视图进行对齐种子中安全事件的实体同一性推理以获得对齐信息,其损失函数如下所示:
其中Θ(1)指关系视图中的嵌入,表示关系视图下进行对齐种子中安全事件的实体同一性推理以获得对齐信息的损失函数,frel(·)表示在关系视图下测量关系事实h,r,t的关系嵌入的合理性的分数函数,h,是来自不同的知识图谱的头实体且存在于对齐种子中,t,是来自不同的知识图谱的尾实体且存在于对齐种子中,χ′和χ″分别指头实体和尾实体位于对齐种子中的关系事实集;
S214:在属性视图进行对齐种子中安全事件的实体同一性推理,其损失函数如下所示:
其中Θ(2)表示属性视图中的嵌入,表示属性视图下进行对齐种子中安全事件的实体同一性推理以获得对齐信息的损失函数,fattr(·)表示在属性视图下测量属性事实a,v嵌入的合理性的分数函数,γ′表示属性事实的集合,表示头实体处于对齐种子中;
S215:在关系视图下进行对齐种子中安全事件的关系同一性推理,使用软对齐方法,在训练中自动找到关系和属性对齐,用以下公式进行表示:
其中Srel表示软关系对齐,即:不要求对齐中的关系严格等效,r,是来自不同的知识图谱的关系,表示它们的相似性,η表示阈值并且η∈(0,1];
S216:考虑到基于文本嵌入的名称相似度和基于关系嵌入的语义相似度,将它们合并为加权和:
其中表示关系r,的相似性,name(r)表示关系r的文本信息,φ(·)表示关系r的文本嵌入,α1,α2>0是两个权重因子,α1+α2=1,cos(·)是计算两个嵌入的余弦相似性函数;
S217:将这种相似性视为平滑系数,以减少不准确对齐的负面影响,并将其合并到交叉关系身份推断的损失中:
其中Θ(1)指关系视图中的嵌入,表示在关系视图下跨知识图谱关系同一性推理的损失函数,表示关系r,的相似性,frel(·)表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数,χ″′表示在Srel中存在关系的关系事实集,Srel表示软关系对齐,即不要求对齐中的关系严格等效;
S218:在属性视图中进行属性同一性推理,根据其软属性对齐和属性相似度计算损失函数:
其中Θ(2)指属性视图中的嵌入,表示在属性视图下跨知识图谱属性同一性推理的损失函数,表示属性a,的相似性,fattr(·)表示在属性视图下测量属性事实h,a,v嵌入的合理性的分数函数,χ(4)表示在Sattr中存在属性关系的属性事实集,Sattr表示软属性对齐,即:不要求对齐中的属性严格等效;
S219:经过k次自迭代后,SE模块训练完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京众智维信息科技有限公司,未经南京众智维信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210184898.7/1.html,转载请声明来源钻瓜专利网。