[发明专利]一种URL地址的解析方法和系统有效
申请号: | 201710389709.9 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107257390B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 姜艳春 | 申请(专利权)人: | 北京思特奇信息技术股份有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12;G06F16/955;G06F16/951;G06F16/28;G06F16/2455;G06F16/2453;G06F16/22 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 url 地址 解析 方法 系统 | ||
本发明特别涉及一种URL地址的解析方法和系统。方法包括以下步骤:建立规则库,所述规则库中包括预设的至少一个分类规则;获取上网日志数据包含的URL地址;读取至少一个分类规则;采用并行处理方法调用至少一个分类规则对所述URL地址进行解析,生成URL地址对应的分类结果;输出所述分类结果。本实施例提出了一种URL地址的解析方法和系统,可以根据解析类型自动形成对应的分类规则并建立规则库,然后采用并行处理方式调用规则库中的至少一个分类规则对URL地址进行解析,从而生成分类结果,不仅提升了解析检测的覆盖范围、提高了解析的精准程度,而且完善了深度解析的能力、大大降低了规则库拨测的成本,具有高效、低成本的优势。
技术领域
本发明涉及数据处理领域,特别涉及一种URL地址的解析方法和系统。
背景技术
在移动互联网迅猛发展,每天都有海量的上网日志产生,其中蕴含着海量的知识和用户行为信息,越来越多的数据需要进行分析、挖掘和学习,这样就给传统DPI技术带来了严峻的考验。DPI技术的主要是通过对网络业务的识别,对网络业务占用资源情况进行分析,了解和跟踪不同业务流量的发展变化趋势和网络资源的占用情况,为流量分析、网络规划、用户行为分析和网络资源的管理提供依据,实现对网络业务应用的精细化管理,综合平衡用户的各种业务体验,发挥出现有网络的最大效益。传统DPI技术是对报文内容和协议特征进行检测的,通过常用的特征识别、关联识别、行为识别等技术来实现应用分析、用户分析、网元分析、流量管控、安全保障等功能。传统DPI技术面对爆炸式数据增长的压力,具有以下的问题:
1、海量的上网日志日积月累,导致解析覆盖范围能力不足;加之现有对报文内容和协议特征进行检测机制也会影响解析的精准程度。
2、由于检测机制的限制,使得解析深度不足,无法识别用户的具体行为,例如浏览的具体内容、电商的具体内容操作行为、内容搜索的具体行为等。
3、当前DPI技术的检测对比规则库是采用人工拨测的方式收集,人工成本高,自动化程度很低,工作效率低,规则库的不足也影响了解析的覆盖范围。
发明内容
本发明提供了一种URL地址的解析方法和系统,解决了当前DPI技术解析覆盖范围少,深度不足,生产效率低等问题。
第一方面,本发明实施例提供了一种URL地址的解析方法,方法包括以下步骤:
步骤1,建立规则库,所述规则库中包括预设的至少一个分类规则;
步骤2,获取上网日志数据包含的URL地址;
步骤3,读取所述至少一个分类规则;
步骤4,采用并行处理方法调用所述至少一个分类规则对所述URL地址进行解析,生成所述URL地址对应的分类结果;
步骤5,输出所述分类结果。
本发明提出了一种URL地址的解析方法,可以根据解析类型自动形成对应的分类规则并建立规则库,然后采用并行处理方式调用规则库中的至少一个分类规则对URL地址进行解析,从而生成分类结果,不仅提升了解析检测的覆盖范围、提高了解析的精准程度,而且完善了深度解析的能力、大大降低了规则库拨测的成本,具有高效、低成本的优势。
进一步,所述分类规则包括噪音匹配规则、App分类规则、URL分类规则、搜索引擎匹配规则、动作匹配规则和自定义规则。
上述优选实施例通过建立包括多个分类规则的规则库,可以对各种类型的URL地址进行解析,并生成对应的分类结果,从而提高本发明的应用范围,也提高了解析的成功率。
第二方面,本发明提供了一种URL地址的解析系统,包括建立模块、获取模块、读取模块、解析模块和输出模块,
所述建立模块用于建立规则库,所述规则库中包括预设的至少一个分类规则;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思特奇信息技术股份有限公司,未经北京思特奇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710389709.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:协同NAT行为发现
- 下一篇:监控设备区域保护的方法