[发明专利]一种基于解析关系的域名图嵌入表示分析方法及装置在审
申请号: | 202110156381.2 | 申请日: | 2021-02-04 |
公开(公告)号: | CN112835995A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 杨学;李洪涛;马永征;刘冰 | 申请(专利权)人: | 中国互联网络信息中心 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/26;G06F16/215;G06F16/245 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 解析 关系 域名 嵌入 表示 分析 方法 装置 | ||
1.一种基于解析关系的域名图嵌入表示分析方法,其特征在于,包括以下步骤:
采集DNS解析数据,并获取域名解析关系;
利用域名解析关系,将“域名-IP-AS”网络图数据映射到反映域名与域名之间关联强度的加权无向域名关系图;
遍历域名关系图中的域名顶点,将命中黑名单的域名标签标记为恶意域名;
利用基于域名解析关系的域名图嵌入算法和恶意域名的标签信息,训练并获得域名关系图中各节点的嵌入表示。
2.根据权利要求1所述的方法,其特征在于,所述利用域名解析关系,将“域名-IP-AS”网络图数据映射到反映域名与域名之间关联强度的加权无向域名关系图,包括:
根据域名解析关系中域名与IP的关联关系将存在共享IP的域名之间建立关联,根据域名解析关系中IP与AS的映射关系将存在相同AS的域名间建立关联;
将存在共享IP的域名之间建立的关联以及存在相同AS的域名间建立的关联,映射到反映域名与域名之间关联强度的加权无向域名关系图。
3.根据权利要求2所述的方法,其特征在于,所述域名关系图中任意两个有相同IP的域名d1和d2之间的边的权重w(d1,d2)为:
w(d1,d2)=1-1/[1+|asn(ip(d1)∩ip(d2))|],
其中,ip(d1)、ip(d2)分别表示域名d1、d2的IP集合,asn()表示域名d1和d2的的共享IP所属的AS的数量。
4.根据权利要求3所述的方法,其特征在于,所述利用基于域名解析关系的域名图嵌入算法和恶意域名的标签信息,训练并获得域名关系图中各节点的嵌入表示,包括:
在node2vec算法中二阶随机游走算法的基础上添加基于节点标签的系数γ,控制游走到恶意域名的概率,再通过p、q两个超参数控制游走到不同图节点的转移概率α,获得节点序列,然后训练神经网络以获取节点嵌入表示。
5.根据权利要求4所述的方法,其特征在于,设在域名关系图G中有N个域名节点,当前游走的节点为v,采用以下步骤采样节点序列:
假设v节点有M个邻居节点,邻居节点集合表示为:
neighbors(v)={n1,n2,…,nM},0≤MN;
假设M个邻居节点中有H个节点标签是恶意的,恶意节点集合表示为:
malicious(v)={m1,m2,…,mH},0≤H≤M;
恶意节点集合malicious(v)是邻居节点集合neighbors(v)的子集,若v节点下一个游走的节点为x,则x∈neighbors(v);设定参数r:
结合二阶随机游走的超参数p、q,控制随机游走到不同类型图节点的转移概率:
其中,t为当前节点v的上一个节点,x为当前节点v游走的下一个节点,dtx为节点t到x之间的最短路径长度,参数p和q控制的是游走序列向外探索和离开原来邻居节点的速率;
从当前节点游走到节点x的概率为:其中,ωvx为当前节点v到下一步节点x之间边的权重,Z为归一化常数;
对周围邻居求概率P(x)的值,P(x)值最大的邻居节点即为下一步到达的邻居节点。
6.根据权利要求1~5中任一权利要求所述的方法,其特征在于,将域名关系图中节点的嵌入表示结果作为下游任务的输入特征,并结合域名的其他维度特征,构建图神经网络进行建模以实现下游任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国互联网络信息中心,未经中国互联网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110156381.2/1.html,转载请声明来源钻瓜专利网。