[发明专利]一种域名的可缓存性分析方法及系统有效
申请号: | 201810720010.0 | 申请日: | 2018-07-03 |
公开(公告)号: | CN110677270B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 章建功;李萍;丁健;齐超;姜帆 | 申请(专利权)人: | 长春亿阳计算机开发有限公司 |
主分类号: | H04L41/14 | 分类号: | H04L41/14;H04L61/4511 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 130022 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 域名 缓存 分析 方法 系统 | ||
1.一种域名的可缓存性分析方法,其特征在于,所述方法包括:
采集步骤:采集域名数据,将所述域名数据导入原始域名数据库;
提取步骤:从所述原始域名数据中提取待分析域名及其中的可缓存特征数据,并进行临时存储;
所述可缓存特征数据包括URL、互联网资源类型、资源属性以及资源文档的过期时间,其中所述互联网资源类型按资源业务特征分类,资源属性包括动态资源和静态资源,所述动态资源为用于进行数据转化后再调用的资源,所述静态资源为用于直接调用的资源;
计算判断步骤:根据所述待分析域名的可缓存特征数据和可缓存分析算法,计算所述域名的缓存数值,根据所述缓存数值与预设值对比,判断所述域名的可缓存性;
所述可缓存分析算法具体为:根据所述待分析域名的可缓存特征数据计算两个指标,包括资源属性为静态资源的数量占URL资源总数量的比例、所述静态资源中文档的过期时间大于缓存时限的比例;根据所述两个指标数值及其所占权重,通过加权求和计算获得所述域名的缓存数值;
当所述缓存数值>预设缓存阈值时,判断所述域名的可缓存性为建议缓存,当所述缓存数值≤预设缓存阈值时,判断所述域名的可缓存性为不建议缓存;
输出步骤:输出所述待分析域名的可缓存性的分析判断结果。
2.根据权利要求1所述的方法,其特征在于,所述可缓存特征数据的资源属性为静态资源的,还包括资源文件长度、资源文件变化周期属性;将所述静态资源分为可缓存对象和不可缓存对象;所述可缓存对象为资源文件变化周期超过设定周期的静态资源,所述不可缓存对象为资源文件变化周期小于或等于设定周期的静态资源;
所述计算判断步骤包括:
根据所述待分析域名的可缓存特征数据计算得到五个指标,包括资源属性为静态资源的数量占URL资源总数量的比例、所述静态资源中的可缓存对象占所述静态资源的比例、所述静态资源中的不可缓存对象占所述静态资源的比例、所述静态资源中的可缓存对象中大文件占静态资源中的可缓存对象总数的比例、所述静态资源中文档的过期时间大于缓存时限的比例;
根据所述五个指标数值及其所占权重,通过加权求和计算获得所述域名的缓存数值;
当所述缓存数值>预设缓存阈值时,判断所述域名的可缓存性为建议缓存,当所述缓存数值≤预设缓存阈值时,判断所述域名的可缓存性为不建议缓存。
3.根据权利要求1或2所述的方法,其特征在于,输出步骤之后,还包括建立可缓存域名库步骤:根据所述域名的可缓存性判断结果建立可缓存域名库,用于保存、查询、更新和分析可缓存域名,动态维护当前最新的可缓存域名;建立可缓存域名库之后,所述采集步骤为:采集域名数据后,与可缓存域名库中的域名进行比对,如果可缓存域名库中存储有待分析域名对应的域名信息,然后直接进入到输出步骤;如果可缓存域名库中没有待分析域名对应的域名信息,则将所述采集的域名数据导入原始域名数据库。
4.根据权利要求1所述的方法,其特征在于,所述采集步骤通过爬虫、DNS日志、DPI数据、抓包方式采集网络资源数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:从原始域名库中提取全网出网流量,统计分析出网请求信息,提供所述全网出网流量的排行情况,为用户是否缓存网站提供决策依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春亿阳计算机开发有限公司,未经长春亿阳计算机开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810720010.0/1.html,转载请声明来源钻瓜专利网。