[发明专利]一种基于链接分析的域名层级结构探测方法有效
申请号: | 201810504726.7 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108804576B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 李瑞轩;文坤梅;龚晶;李玉华;辜希武;彭城易;许武奎 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/906;G06F16/27;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于链接分析的域名层级结构探测方法,包括:对初始URL进行数据爬取并跟踪链接进行深度分布式爬取,得到待分析机构的域名集合与域名链接关系;利用待分析机构的域名集合与域名链接关系构建链接网络有向图,利用链接网络有向图进行聚类计算,得到聚类结果,计算链接有向图中每个节点的重要度;利用聚类结果和链接有向图中每个节点的重要度对链接网络有向图进行有向图边加权,得到加权有向图;在加权有向图上使用基于最短路的算法计算节点从属关系,得到待分析机构的域名从属关系树形结构。本发明具有较高的数据爬取效率和域名采集覆盖率;本发明在保证结构提取高效性的同时,也极大提高了域名从属关系探测的准确率。 | ||
搜索关键词: | 一种 基于 链接 分析 域名 层级 结构 探测 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810504726.7/,转载请声明来源钻瓜专利网。