[发明专利]一种基于知识图谱和图片特征的诈骗网站识别方法与系统有效
申请号: | 202110764714.X | 申请日: | 2021-07-07 |
公开(公告)号: | CN113254844B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 漆伟;张瑞冬;马永霄;童永鳌;朱鹏;张浩 | 申请(专利权)人: | 成都无糖信息技术有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/35;G06F16/36;G06K9/42;G06K9/46;G06N3/04 |
代理公司: | 成都为知盾专利代理事务所(特殊普通合伙) 51267 | 代理人: | 李汉强 |
地址: | 610000 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 图片 特征 诈骗 网站 识别 方法 系统 | ||
1.一种基于知识图谱和图片特征的诈骗网站识别方法,其特征在于,包括:
步骤1:采集现有的诈骗网站有效的网站截图并进行分类,然后获取所述网站截图的图片特征,并构建图片特征库进行对应的分类,用于存储不同类的图片特征,实时提取未知网站的图片特征,将所述提取未知网站的图片特征与所述图片特征库中的所有特征进行匹配,最后根据阈值确定未知网站的类别;
步骤2:获取步骤1中诈骗网站的网站信息数据,根据信息数据构建数据关系图,并将数据关系图以三元组的形式录入知识图谱库中,然后计算知识图谱库中每个节点在全局知识图谱库的关系权重;
步骤3:实时获取步骤1中未知网站的图片特征与图片特征库的匹配结果,
当匹配成功时,将匹配成功的网站的数据关系图更新录入到知识图谱库中,图片特征更新录入到图片特征库中;
当匹配失败或者匹配为非诈骗时,将这些未知网站的数据信息通过知识图谱库进行匹配验证,得到这些未知网站的诈骗网站疑似度分数和疑似诈骗网站类别;然后构建图片二分类模型对疑似诈骗网站进行判别,若判别为诈骗网站,则将该诈骗网站的数据更新到知识图谱库和图片特征库中。
2.根据权利要求1所述的一种基于知识图谱和图片特征的诈骗网站识别方法,其特征在于,步骤1具体为:
步骤1.1:采集现有的诈骗网站有效的网站截图并进行分类;
步骤1.2:构建基于无监督的深度卷积神经网络图片自编码器模型,提取所述网站截图的图片特征,并通过所述网站截图进行模型的反复学习;
步骤1.3:模型训练完成后,以图片为输入,图片特征为输出,部署图片自编码器模型,通过图片自编码器模型获取图片的图片特征向量并分类,构建对应类的图片特征库用于存入不同类的图片特征向量;
步骤1.4:通过对未知网站的网站截图进行图片提取模型提取图片特征,将该图片特征与图片特征库的所有特征进行计算欧式距离,然后进行计算判断该未知网站是否属于诈骗网站;并根据阈值对诈骗网站进行分类。
3.根据权利要求2所述的一种基于知识图谱和图片特征的诈骗网站识别方法,其特征在于,步骤1.2是构建基于无监督的深度卷积神经网络的图片自编码器模型进行诈骗类图片的编码和解码的学习,具体为:
步骤1.2.1:将获取的网站截图缩放到固定的尺寸并对图片进行均值化和归一化处理;
步骤1.2.2:将处理好的的图片数据经过第一层的深度卷积神经网络获取到图片的浅层轮廓信息特征;
步骤1.2.3:将获取的浅层轮廓信息特征经过第二层的深度卷积神经网络获取到图片的浅层的底层信息特征;
步骤1.2.4:将底层信息特征经过第三层的深度卷积神经网络获取到图片的深层语义信息特征;
步骤1.2.5:将语义信息特征经过第四层的深度卷积神经网络获取更精细的语义信息作为最终的图片特征;
步骤1.2.6:将图片特征进行同等比例的还原,最终恢复到图片的原始大小,把原始图片数据和还原的图片数据构建重构误差;
步骤1.2.7:对诈骗类网站的有效截图进行模型的反复学习,直到模型拟合和重构误差达到最小。
4.根据权利要求1所述的一种基于知识图谱和图片特征的诈骗网站识别方法,其特征在于,步骤2中网站数据信息具体包括:网站IP信息、所属机房信息、网页的body hash值、网站域名、网站注册域名、域名注册人、域名注册人邮箱、域名注册商和网
站证书域名,根据数据信息构建数据关系图具体为:
步骤2.1:构建节点:网站IP信息、所属机房信息、网页的body hash值、网站域名、网站注册域名、域名注册人、域名注册人邮箱、域名注册商和网站证书域名,将这些字段信息作为关系图中的节点;
步骤2.2:构建关系:根据节点之间的关系构建图谱所需要的三元组关系;
步骤2.3:构建属性:根据已知的诈骗网站类别,把对应的类型信息录入为网站域名的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都无糖信息技术有限公司,未经成都无糖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110764714.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:血浆保存液及其应用
- 下一篇:一种用于深度学习的工作量证明共识方法及系统