[发明专利]一种图谱构建方法、装置、存储介质和计算机设备有效
申请号: | 201911264939.8 | 申请日: | 2019-12-11 |
公开(公告)号: | CN112948638B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 肖书俊;吴晨花;李铭学;陈达;陈海霞 | 申请(专利权)人: | 中国移动通信集团海南有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/908;H04L61/4511 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯伟 |
地址: | 570110 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图谱 构建 方法 装置 存储 介质 计算机 设备 | ||
本发明实施例提供了一种图谱构建方法、装置、存储介质和计算机设备。本发明实施例的方案中,将有效域名系统日志数据中的每条有效数据记录中的第一个域名确定为查询域名;将每条有效数据记录中的除查询域名之外的域名确定为规范名字;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;根据第一调度图和第二调度图,构建规范名字图谱,采用构建规范名字图谱的方法对有效域名系统日志数据进行分析,保证了数据的全面性、准确性和及时性,并且可以洞察到有效域名系统日志数据的迭代过程。
【技术领域】
本发明涉及数据处理技术领域,尤其涉及一种图谱构建方法、装置、存储介质和计算机设备。
【背景技术】
目前常见的对内容分发网络(Content Delivery Network,简称:CDN)调度分析方法,主要是通过构建网际互连协议(Internet Protocol,简称:IP)地址和CDN节点之间的映射关系,对业务IP翻译对应的CDN归属,此分析方法难以保证IP地址和CDN节点之间的映射关系的数据全面性、准确性和及时性,而且仅能做到分析最终结果,无法洞察调度过程中的域名的迭代过程。
【发明内容】
有鉴于此,本发明实施例提供了一种图谱构建方法、装置、存储介质和计算机设备,可以。
一方面,本发明实施例提供了一种图谱构建方法,所述方法包括:
获取有效域名系统日志数据,有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;
将每条有效数据记录中的第一个域名确定为查询域名;
将每条有效数据记录中的除查询域名之外的域名确定为规范名字;
根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;
根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;
根据第一调度图和第二调度图,构建规范名字图谱。
可选地,获取域名系统有效日志数据,具体包括:
获取域名系统日志数据;
对域名系统日志数据进行清洗,生成有效域名系统日志数据。
可选地,第一调度图包括两个顶点和所述两个顶点之间的有向边;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图,包括:
将查询域名确定为所述第一调度图的一个顶点;
将第1个规范名字的有向路径确定为第一调度图的另一个顶点;
将从查询域名至第1个规范名字的有向路径确定为第一调度图中的两个顶点之间的有向边。
可选地,第二调度图包括多个顶点和多条有向边;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图,包括:
按照从查询域名至第1个规范名字的有向路径、从第1个规范名字至第N个规范名字的有向路径,将查询域名、第1个规范名字至第N个规范名字拆分成多个域名对,每个域名对包括两个域名和两个域名之间的有向路径,N包括正整数;将查询域名、第1个规范名字至第N个规范名字确定为第二调度图中的顶点;将两个域名之间的有向路径确定为第二调度图中相应的顶点之间的有向边。
可选地,根据第一调度图和第二调度图,构建规范名字图谱,包括:
对第一调度图进行标准化预处理,生成第一有向图,第一有向图包括多个顶点和多条有向边;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团海南有限公司;中国移动通信集团有限公司,未经中国移动通信集团海南有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911264939.8/2.html,转载请声明来源钻瓜专利网。