[发明专利]一种网页审计方法及装置无效
申请号: | 201010545074.5 | 申请日: | 2010-11-16 |
公开(公告)号: | CN102004770A | 公开(公告)日: | 2011-04-06 |
发明(设计)人: | 许志宏;张晓东;田涛;李晶楠 | 申请(专利权)人: | 杭州迪普科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 审计 方法 装置 | ||
1.一种网页审计装置,其应用于网络设备中,用于对用户的上网行为进行审计,包括URL提取单元、主次链接过滤单元以及解压缩处理单元,其特征在于:
所述URL提取单元,用于从用户的HTTP请求报文中提取用户访问的URL,并将提取到的URL提交给主次链接过滤单元;
所述主次链接过滤单元,用于根据预定规则从提交的URL中过滤出代表主要链接的主要URL,并将所述主要URL提交解压缩处理单元;
所述解压缩处理单元、用于对用户访问所述主要URL的报文进行解压缩处理,并从中获得所述主要URL所指向的网页的特征信息,然后将所述特征信息作为审计日志信息保存起来。
2.根据权利要求1所述的装置,其特征在于,其中所述网络设备至少一个物理CPU,所述物理CPU被虚拟为多个虚拟CPU,该装置还包括:内存管理单元,用于以运行解压缩处理单元的虚拟CPU为单元进行内存申请。
3.根据权利要求1所述的装置,其特征在于,还包括:HTTP报文识别单元,用于根据HTTP请求报文的特征从用户报文中识别出HTTP请求报文,并将识别到的HTTP请求报文提交给URL提取单元。
4.根据权利要求1所述的装置,其特征在于,其中所述特征信息为网页标题。
5.根据权利要求1所述的装置,其特征在于,所述预定规则包括:判断所述URL中是否携带有URL参数,若未携带URL参数则判定为代表主要链接的URL,若携带有URL参数,则判定将该URL作为次要链接丢弃;
或者判断HTTP请求头中的“Content-Type”字段中的值是否为text/*类型,如果是则判定为主要链接,如果不是则判定为次要链接。
6.根据要求5所述的装置,其中所述特征信息为网页标题,所述预定规则进一步包括:判断代表主要链接的主要URL所指向的网页是否具有可以提取的标题,如果没有则放弃保存所述网页标题。
7.一种网页审计方法,其应用于网络设备中,用于对用户的上网行为进行审计,其特征在于,该方法包括:
步骤A、从用户的HTTP请求报文中提取用户访问的URL;
步骤B、根据预定规则从步骤A提取的URL中过滤出代表主要链接的主要URL;
步骤C、对用户访问所述主要URL的报文进行解压缩处理,并从中获得所述主要URL所指向的网页的特征信息,然后将所述特征信息作为审计日志信息保存起来。
8.根据权利要求7所述的方法,其特征在于,其中所述网络设备至少一个物理CPU,所述物理CPU被虚拟为多个虚拟CPU,步骤C中解压缩处理的内存申请是以运行解压缩处理的虚拟CPU为单元进行的。
9.根据权利要求7所述的方法,其特征在于,还包括:步骤A之前还包括步骤D,根据HTTP请求报文的特征从用户报文中识别出HTTP请求报文。
10.根据权利要求7所述的方法,其特征在于,其中所述特征信息为网页标题。
11.根据权利要求7所述的方法,其特征在于,所述预定规则包括:判断所述URL中是否携带有URL参数,若未携带URL参数则判定为代表主要链接的URL,若携带有URL参数,则判定将该URL作为次要链接丢弃;
或者判断HTTP请求头中的“Content-Type”字段中的值是否为text/*类型,如果是则判定为主要链接,如果不是则判定为次要链接。
12.根据要求11所述的方法,其中所述特征信息为网页标题,所述预定规则进一步包括:判断代表主要链接的主要URL所指向的网页是否具有可以提取的标题,如果没有则放弃保存所述网页标题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技有限公司,未经杭州迪普科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010545074.5/1.html,转载请声明来源钻瓜专利网。