[发明专利]基于HTML的网站行为模型建模方法有效

专利信息
申请号: 201110121990.0 申请日: 2011-05-12
公开(公告)号: CN102780682A 公开(公告)日: 2012-11-14
发明(设计)人: 蒋昌俊;陈闳中;闫春钢;丁志军;许华杰;葛雍龙 申请(专利权)人: 同济大学
主分类号: H04L29/06 分类号: H04L29/06;G06F21/00
代理公司: 上海光华专利事务所 31219 代理人: 余明伟
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 html 网站 行为 模型 建模 方法
【权利要求书】:

1.一种基于HTML的网站行为模型建模方法,其应用在连接有网络系统的客户端中,且所述客户端通过所述网络系统实现对网站提供商提供的网站进行访问,所述方法包括:

1)通过所述网络系统获取网站提供商所提供的网站的源代码,并从所获取的源代码中提取网站所有网页的HTML代码,HTML代码中包含多个类型标签以及行为属性;以及

2)扫描该网页的HTML代码,依据HTML代码中不同类型的标签以及行为属性,记录每一类型标签中的各种行为以及每一行为发生后的状态,以由各个相关联的行为与状态形成行为序列,而由此形成的多个行为序列的集合最终构建成网站行为模型。

2.根据权利要求1所述的基于HTML的网站行为模型建模方法,其特征在于,所述类型标签为<a>、<form>、<input>或<button>。

3.根据权利要求2所述的基于HTML的网站行为模型建模方法,其特征在于,对应<a>类型标签的行为为点击超链接类型行为以及网页跳转类型行为;对应<form>类型标签的行为为提交数据类型行为;对应<input>或<button>类型标签的行为为点击按钮类型行为。

4.根据权利要求3所述的基于HTML的网站行为模型建模方法,其特征在于,所述步骤2)进一步包括:

2-1)创建一个网址类型的状态S0,取变量i=1,并将首页加入网址队列中;

2-2)判断网址队列是否为空,若是,则建模完成,若否,则从网址队列的队首取出一个网址,并记录下网站所有状态集中其相应的网址类型的状态Sj,且获取其对应页面的HTML代码;

2-3)扫描所获取的HTML代码,当遇到HTML代码中的<a>标签,进至下一个步骤;当遇到HTML代码中的<form>标签且其行为属性为提交数据类型时,进至步骤2-5);否则,直至扫描完HTML代码,返回步骤2-2);

2-4)创建一个点击超链接类型的状态Si,以及一个相应的网址类型的状态Si+1,若状态Si+1不属于网站所有状态集,则将状态Si+1加入网站所有状态集中,并将<a>标签中的超链接的网址加入网址队列,并且在状态Si的行为集添加网页跳转类型行为,并将状态Si+1加入到在状态Si下发生该网页跳转类型行为后可能到达的状态集中,在状态Sj的行为集添加点击超链接类型行为,将状态Si加入到在状态Sj下发生该点击超链接类型行为后可能到达的状态集中,将变量i+2赋值给i,并返回到步骤2-3)继续扫描;以及

2-5)创建一个提交数据类型的状态Si,若状态Si不属于网站所有状态集,则将状态Si加入网站所有状态集,并继续扫描<form>中的子标签,当遇到<input>或<button>,则创建一个点击按钮类型的状态Si+1,并且在状态Si+1的行为集添加提交数据类型行为,将状态Si加入到在状态Si+1下发生该提交数据类型行为后可能到达的状态集中,在状态Sj的行为集添加点击按钮类型行为,将状态Si+1加入到在状态Sj下发生该点击按钮类型行为后可能到达的状态集中,将变量i+2赋值给i,并返回到步骤2-3)继续扫描。

5.根据权利要求4所述的基于HTML的网站行为模型建模方法,其特征在于,所述状态为稳定状态或非稳定状态。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110121990.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top