[发明专利]第三方WEB应用程序发现的方法和装置有效

专利信息
申请号: 201010610790.7 申请日: 2010-12-29
公开(公告)号: CN102063484A 公开(公告)日: 2011-05-18
发明(设计)人: 胡星儒;李柏松 申请(专利权)人: 北京安天电子设备有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F21/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100085 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 第三 web 应用程序 发现 方法 装置
【权利要求书】:

1.一种第三方WEB应用程序发现的方法,其特征在于,包括:

判断待检测URL对应的HTML页面是否存在,如果是,则下载待检测URL对应的HTML页面;

以HTML标签作为DOM树结构的索引,将HTML页面解析为DOM树结构;

提取指定HTML标签中的子URL,如果子URL中的目的网站子URL的数量达到预设的阈值,则将目的网站子URL的文件默认路径特征与第三方WEB应用程序特征数据库中的特征进行匹配;并且,提取DOM树结构中的信息特征,将信息特征与第三方WEB应用程序特征数据库中的特征进行匹配;

如果在第三方WEB应用程序模型数据库中查找到所有匹配成功的特征,则确定待检测URL对应的HTML页面中包含第三方WEB应用程序。

2.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,判断待检测URL对应的HTML页面是否存在包括:通过判断HTTP响应消息判断待检测URL对应的HTML页面是否存在;

下载待检测URL的HTML页面信息包括:按照HTTP请求方法下载待检测URL的HTML页面信息。

3.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,判断待检测URL对应的HTML页面存在之后还包括:判断待检测URL的来源属性。

4.如权利要求3所述的第三方WEB应用程序的发现方法,其特征在于,判断待检测URL的来源属性包括:如果待检测URL的来源属性不是目的网站子URL、需判断HASH值的URL、文件默认路径URL中的其中一种,则确定待检测URL的来源属性为用户提交的根URL。

5.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,提取指定HTML标签中的子URL之后,还包括:

判断子URL的域名

如果子URL包含待检测URL对应的完整域名,则确定子URL为目的网站子URL,标记来源属性为目的网站子URL;

如果子URL包含待检测URL对应的父域名而不包含待检测URL对应的完整域名,则确定子URL为目的网站子域名URL;

如果子URL既不包含待检测URL对应的完整域名,又不包含待检测URL对应的父域名,则确定子URL为第三方URL。

6.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,如果子URL中的目的网站子URL的数量没有达到预设的阈值,则将目的网站子URL作为待检测URL进行检测。

7.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,将目的网站子URL的文件默认路径特征与第三方WEB应用程序特征数据库中的特征进行匹配包括:

对所有目的网站子URL去掉待检测URL对应的完整域名,截取文件默认路径特征,与第三方WEB应用程序特征数据库中的文件默认路径特征进行匹配,记录匹配成功的文件默认路径特征;

将第三方WEB应用程序特征数据库中没有匹配成功的文件默认路径特征与待检测URL对应的完整域名组合成为新的URL,来源属性标记为文件默认路径URL,将新的URL作为待检测URL进行检测。

8.如权利要求5所述的第三方WEB应用程序的发现方法,其特征在于,如果确定子URL为第三方URL,则判断第三方URL是否有跳转行为,如果有,则判定待检测URL对应的HTML页面中包含第三方WEB应用程序。

9.如权利要求1所述的第三方WEB应用程序的发现方法,其特征在于,提取DOM树结构中的信息特征,将信息特征与第三方WEB应用程序特征数据库中的特征进行匹配包括:

如果在第三方WEB应用程序特征数据库中没有信息特征对应的文件HASH值匹配属性,则记录该信息特征为匹配成功的特征;

如果在第三方WEB应用程序特征数据库中有信息特征对应的文件HASH值匹配属性,则将该信息特征与待检测URL组合为新的待检测URL进行检测,来源属性标记为需判断HASH值的URL。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安天电子设备有限公司,未经北京安天电子设备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010610790.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top