[发明专利]网页识别方法、装置、计算机设备及存储介质有效
申请号: | 201711297266.7 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108092963B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 王元铭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08;H04L29/12;G06F16/951 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518052 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 识别 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及一种网页识别方法、装置、计算机设备及存储介质。该方法包括获取已识别的风险等级大于预设等级的网页,提取网页对应的网站域名;根据网站域名获取网站对应的网络地址;查找与网络地址关联的域名,当查找到与网络地址关联的域名时,则将关联的域名作为待识别域名;获取待识别域名对应的网站中的网页数据;根据所获取的网页数据得到与待识别域名对应的风险等级大于预设等级的网页。上述网页识别方法、装置、计算机设备及存储介质,可以通过一个风险等级大于预设等级的网页查询到相关联的多个风险等级大于预设等级的网页,查询效率高。
技术领域
本发明涉及网络安全领域,特别是涉及一种网页识别方法、装置、计算机设备及存储介质。
背景技术
随着互联网科技的发展,人们越来越多的活动在网络上进行,例如在网络上进行交易,在网络上办理相应的银行业务等,由此会出现一些伪装成银行的网站,在用户访问时会窃取用户在使用该类网站时提交的银行账号、密码等私密信息,若不及时发现该类具有威胁性的网站,会威胁用户的财产安全,危害用户的利益。
传统地,由于每天会产生大量的网页,则需要从互联网上产生的大量的网页中选取可能具有威胁性的目标网页,进而对选取到的目标网页进行繁琐的分析,使得识别目标网页为风险等级是否大于预设等级的效率不高。
发明内容
基于此,有必要针对识别目标网页的风险等级是否大于预设等级的效率不高的问题,提供一种网页识别方法、装置、计算机设备及存储介质。
一种网站识别方法,包括:
获取已识别的风险等级大于预设等级的网页,提取所述网页对应的网站域名;
根据所述网站域名获取所述网站对应的网络地址;
查找与所述网络地址关联的域名,当查找到与所述网络地址关联的域名时,则将所述关联的域名作为待识别域名;
获取所述待识别域名对应的网站中的网页数据;
根据所获取的网页数据得到与所述待识别域名对应的风险等级大于预设等级的网页。
在其中一个实施例中,所述查找与所述网络地址关联的域名的步骤,包括:
将所述网络地址与地址关联库中预存储的网络地址进行匹配;
当所述网络地址与所述地址关联库中预存储的网络地址匹配成功时,获取与所述预存储的网络地址关联的待匹配关联域名;
获取所述待匹配关联域名的有效截止时间;
若当前时间小于等于所述有效截止时间时,则提取所述待匹配关联域名作为待识别域名。
在其中一个实施例中,所述方法还包括:
当未查找到与所述网络地址关联的域名时,则获取所述网站的域名对应的注册数据,根据所述注册数据查询对应的域名作为待识别域名。
在其中一个实施例中,所述获取所述网站的域名对应的注册数据,根据所述注册数据查询对应的域名作为待识别域名的步骤,包括:
获取所述网站的域名对应的注册数据,从转换逻辑库中选取所述注册数据对应的转换逻辑;
根据所述转换逻辑将所述注册数据进行转换得到转换后的注册数据;
将所述转换后的注册数据与信息存储库中存储的信息数据进行匹配;
当转换后的注册数据与信息存储库中存储的信息数据匹配成功时,则获取匹配成功的所述信息数据关联的域名作为待识别域名。
在其中一个实施例中,所述根据所获取的网页数据得到与所述待识别域名对应的风险等级大于预设等级的网页的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711297266.7/2.html,转载请声明来源钻瓜专利网。