[发明专利]网页处理方法和装置在审
申请号: | 201410217134.9 | 申请日: | 2014-05-21 |
公开(公告)号: | CN105095309A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 蔡木卢 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 李志刚;吴贵明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 处理 方法 装置 | ||
1.一种网页处理方法,其特征在于,包括:
通过访问目标网页提取所述目标网页的表单信息;
向所述表单信息中插入截取程序,其中,所述截取程序用于截取所述目标网页的身份信息;
将插入所述截取程序的表单信息提交至所述目标网页;
在所述表单信息被浏览时,通过运行所述截取程序截取所述目标网页的身份信息;以及
利用所述身份信息访问所述目标网页并删除所述目标网页的网页内容,其中,所述网页内容为与所述表单信息对应的网页内容。
2.根据权利要求1所述的方法,其特征在于,提取所述目标网页的表单信息包括:
获取所述目标网页的页面信息;
判断所述页面信息中是否包含所述表单信息;
如果所述页面信息中包含所述表单信息,则提取所述表单信息;以及
如果所述页面信息中不包含所述表单信息,则获取所述目标网页的框架信息,并通过所述框架信息提取所述表单信息。
3.根据权利要求2所述的方法,其特征在于,通过所述框架信息提取所述表单信息包括:
根据所述框架信息判断所述目标网页中是否嵌入有嵌入网页;
如果所述目标网页中有所述嵌入网页,则检测所述嵌入网页中的表单信息;以及
在检测出所述嵌入网页中的表单信息之后,提取所述嵌入网页中的表单信息。
4.根据权利要求1所述的方法,其特征在于,将插入所述截取程序的表单信息提交至所述目标网页包括:
获取所述表单信息的提交地址;
判断所述提交地址是否为所述目标网页的绝对地址;
如果所述提交地址不是所述绝对地址,通过对所述提交地址进行映射得到所述绝对地址;以及
将插入所述截取程序的表单信息提交至通过映射得到的所述绝对地址。
5.根据权利要求1所述的方法,其特征在于,在通过运行所述截取程序截取所述目标网页的身份信息之后,所述方法还包括:
利用所述身份信息获取所述目标网页的网页内容;
保存所述网页内容;以及
按照所述网页内容的类别发出预定告警信息。
6.一种网页处理装置,其特征在于,
提取单元,用于通过访问目标网页提取所述目标网页的表单信息;
插入单元,用于向所述表单信息中插入截取程序,其中,所述截取程序用于截取所述目标网页的身份信息;
提交单元,用于将插入所述截取程序的表单信息提交至所述目标网页;
截取单元,用于在所述表单信息被浏览时,通过运行所述截取程序截取所述目标网页的身份信息;以及
删除单元,用于利用所述身份信息访问所述目标网页并删除所述目标网页的网页内容,其中,所述网页内容为与所述表单信息对应的网页内容。
7.根据权利要求6所述的装置,其特征在于,所述提取单元包括:
第一获取模块,用于获取所述目标网页的页面信息;
判断模块,用于判断所述页面信息中是否包含所述表单信息;
提取模块,用于在所述页面信息中包含所述表单信息时,提取所述表单信息;以及
第二获取模块,用于在所述页面信息中不包含所述表单信息时,获取所述目标网页的框架信息,并通过所述框架信息提取所述表单信息。
8.根据权利要求7所述的装置,其特征在于,所述第二获取模块包括:
判断子模块,用于根据所述框架信息判断所述目标网页中是否嵌入有嵌入网页;
检测子模块,用于在所述目标网页中有所述嵌入网页时,检测所述嵌入网页中的表单信息;以及
提取子模块,用于在检测出所述嵌入网页中的表单信息之后,提取所述嵌入网页中的表单信息。
9.根据权利要求6所述的装置,其特征在于,所述插入单元包括:
地址获取模块,用于获取所述表单信息的提交地址;
地址判断模块,判断所述提交地址是否为所述目标网页的绝对地址;
映射模块,用于在所述提交地址不是所述绝对地址时,通过对所述提交地址进行映射得到所述绝对地址;以及
提交模块,用于将插入所述截取程序的表单信息提交至通过映射得到的所述绝对地址。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取单元,用于在通过运行所述截取程序截取所述目标网页的身份信息之后,利用所述身份信息获取所述目标网页的网页内容;
保存单元,用于保存所述网页内容;以及
告警单元,用于按照所述网页内容的类别发出预定告警信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410217134.9/1.html,转载请声明来源钻瓜专利网。