[发明专利]网络关系构建方法及系统有效
申请号: | 202110129962.7 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112968875B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 颜新兴;周亚超;冯一 | 申请(专利权)人: | 上海安恒时代信息技术有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L61/4511 |
代理公司: | 上海恒锐佳知识产权代理事务所(普通合伙) 31286 | 代理人: | 黄海霞 |
地址: | 201306 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 关系 构建 方法 系统 | ||
1.一种网络关系构建方法,其特征在于,包括以下步骤:
S1:输入已知网络黑产网站;
S2:通过所述已知网络黑产网站,提取网页静态链接;
S3:根据所述网页静态链接,构建网站通联关系;
S4:根据所述网站通联关系,构建网络黑产产业链关系;
所述步骤S2包括以下步骤:
S21:通过所述已知网络黑产网站的URL提取网站域名;
S22:根据所述网站域名,获取子域名;
S23:根据所述网站域名和所述子域名,获取网页源码信息;
S24:从所述网页源码信息中根据预设的条件提取网页静态链接;
所述步骤S3包括以下步骤:
S31:统计所述网页静态链接在不同网站中获取的数目,将数目最多的所述网页静态链接作为中心网页静态链接;
S32:以所述中心网页静态链接为中心,构建所述网站通联关系;
所述步骤S4包括以下步骤:
S41:根据所述网站通联关系,查找关联所述网页静态链接数量最多的TOP值网站;
S42:根据所述TOP值网站,获取网页源码信息;
S43:将所述网页源码信息与黑产关键词库进行匹配,以获取匹配度结果;
S44:将所述匹配度结果与预设匹配度阈值进行对比,以确定是否为产业链上网络黑产网站;
S45:将所述产业链上网络黑产进行类型标定,构建网络黑产产业链关系。
2.根据权利要求1所述的网络关系构建方法,其特征在于,所述步骤S1包括以下步骤:
S11:通过网络扒取网站,对所述网站进行解析以得到网页源码信息;
S12:将所述网页源码信息与黑产关键词库进行匹配,以获取匹配度结果;
S13:将所述匹配度结果与预设匹配度阈值进行对比,以判断所述网站是否为所述网络黑产网站。
3.根据权利要求2所述的网络关系构建方法,其特征在于,所述预设匹配度阈值包括第一匹配阈值和第二匹配阈值,所述第一匹配阈值小于所述第二匹配阈值,所述步骤S13包括:
若所述匹配度结果小于所述第一匹配阈值,则所述网站为非网络黑产网站;
若所述匹配度结果大于所述第二匹配阈值,则所述网站为网络黑产网站,并将所述网络黑产网站作为所述已知网络黑产网站。
4.根据权利要求1所述的网络关系构建方法,其特征在于,所述步骤S32中,前一层关系已绘制则不重复绘制。
5.根据权利要求1所述的网络关系构建方法,其特征在于,所述预设匹配度阈值包括第一匹配阈值和第二匹配阈值,所述第一匹配阈值小于所述第二匹配阈值,所述步骤S44包括:
若所述匹配度结果小于所述第一匹配阈值,则所述网站为非网络黑产网站;
若所述匹配度结果大于所述第二匹配阈值,则所述网站为所述产业链上网络黑产网站。
6.根据权利要求3或5所述的网络关系构建方法,其特征在于,所述第一匹配阈值为40%,所述第二匹配阈值为70%。
7.一种网络关系构建系统,用于实现如权利要求1-6任一项所述网络关系构建方法,其特征在于,包括输入模块、网页静态链接提取模块、网站通联关系构建模块和黑产产业链关系构建模块,所述输入模块、所述网页静态链接提取模块、所述网站通联关系构建模块与所述黑产产业链关系构建模块通信连接,所述输入模块接收已知网络黑产网站,所述输入模块将所述已知网络黑产网站发送给所述网络静态链接提取模块,所述网页静态链接提取模块通过所述已知网络黑产网站提取网页静态链接,并传输给所述网站通联关系构建模块,所述网站通联关系构建模块根据所述网页静态链接构建网站通联关系,所述黑产产业链关系构建模块根据所述网站通联关系构建网络黑产产业链关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海安恒时代信息技术有限公司,未经上海安恒时代信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110129962.7/1.html,转载请声明来源钻瓜专利网。