[发明专利]域名检测方法、域名检测装置和设备以及介质有效
申请号: | 202010946789.5 | 申请日: | 2020-09-10 |
公开(公告)号: | CN111818198B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 马江夏;林智鑫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12;H04L29/06;H04L29/08;G06K9/62 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 域名 检测 方法 装置 设备 以及 介质 | ||
本申请提供了一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。所述域名检测方法包括:获取待检测域名;对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及基于所述处理的结果确定并输出所述待检测域名的检测结果。
技术领域
本申请涉及互联网领域,并且具体地涉及一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。
背景技术
在如今的互联网环境中,网络安全变得日益重要,例如威胁情报的网络安全信息对于网络安全分析和运维至关重要。威胁情报,也称为IOC(Indicator of Compromise,威胁指示)情报,是一种基于证据的知识,包括了情境、机制、指标、隐含和实际可行的建议。威胁情报描述了现存的、或者是即将出现的针对资产的威胁或危险,并可以用于通知主体针对相关威胁或危险采取某种响应。目前,威胁情报主要来源于开源情报和沙箱情报,而开源情报依赖于开源数据和各大情报厂商,缺乏自主性,沙箱情报则情报类型单一、数量有限。域名检测可以用于获取威胁情报,然而,当前域名检测常依赖于人工鉴定,效率低下,难以处理大量的域名数据。因此,需要一种能够高效准确地进行域名检测的方法。
近年来,机器学习技术快速发展。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。机器学习技术给域名检测提供了新的思路。
发明内容
为了克服现有技术中存在的缺陷,本申请提出了一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。
根据本申请的一个方面,提供了一种域名检测方法,包括:获取待检测域名;对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及基于所述处理的结果确定并输出所述待检测域名的检测结果。
根据本申请的一个示例,其中,所述安全风险等级类别是黑域名、白域名和灰域名中的一个,并且其中,黑域名为安全风险高的域名,白域名为安全风险低的域名,灰域名为安全风险处于黑域名和白域名之间的域名。
根据本申请的一个示例,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:提取所述待检测域名的域名字符特征、样本关联特征、域名属性特征和网络访问特征中的至少一部分特征,作为所述待检测域名的特征数据;以及利用所述待检测域名的特征数据,生成所述特征向量。
根据本申请的一个示例,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:利用图形数据库对所述域名进行分析,以提取所述待检测域名的特征向量,其中,所述图形数据库存储域名与其特征向量的对应关系。
根据本申请的一个示例,其中,对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量包括:确定所述待检测域名的特征向量是否稀疏;以及在确定所述特征向量不稀疏的情况下,确定所述特征向量为有效特征向量;在所述特征向量稀疏的情况下,丢弃所述特征向量,其中,所述稀疏指示所述待检测域名在预定时间段内未被访问、被解析且被浏览过。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010946789.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据文件流转的审批系统
- 下一篇:知识图谱构建方法、装置、电子设备及存储介质