[发明专利]基于HTML的网站行为模型建模方法有效
申请号: | 201110121990.0 | 申请日: | 2011-05-12 |
公开(公告)号: | CN102780682A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 蒋昌俊;陈闳中;闫春钢;丁志军;许华杰;葛雍龙 | 申请(专利权)人: | 同济大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F21/00 |
代理公司: | 上海光华专利事务所 31219 | 代理人: | 余明伟 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 html 网站 行为 模型 建模 方法 | ||
1.一种基于HTML的网站行为模型建模方法,其应用在连接有网络系统的客户端中,且所述客户端通过所述网络系统实现对网站提供商提供的网站进行访问,所述方法包括:
1)通过所述网络系统获取网站提供商所提供的网站的源代码,并从所获取的源代码中提取网站所有网页的HTML代码,HTML代码中包含多个类型标签以及行为属性;以及
2)扫描该网页的HTML代码,依据HTML代码中不同类型的标签以及行为属性,记录每一类型标签中的各种行为以及每一行为发生后的状态,以由各个相关联的行为与状态形成行为序列,而由此形成的多个行为序列的集合最终构建成网站行为模型。
2.根据权利要求1所述的基于HTML的网站行为模型建模方法,其特征在于,所述类型标签为<a>、<form>、<input>或<button>。
3.根据权利要求2所述的基于HTML的网站行为模型建模方法,其特征在于,对应<a>类型标签的行为为点击超链接类型行为以及网页跳转类型行为;对应<form>类型标签的行为为提交数据类型行为;对应<input>或<button>类型标签的行为为点击按钮类型行为。
4.根据权利要求3所述的基于HTML的网站行为模型建模方法,其特征在于,所述步骤2)进一步包括:
2-1)创建一个网址类型的状态S0,取变量i=1,并将首页加入网址队列中;
2-2)判断网址队列是否为空,若是,则建模完成,若否,则从网址队列的队首取出一个网址,并记录下网站所有状态集中其相应的网址类型的状态Sj,且获取其对应页面的HTML代码;
2-3)扫描所获取的HTML代码,当遇到HTML代码中的<a>标签,进至下一个步骤;当遇到HTML代码中的<form>标签且其行为属性为提交数据类型时,进至步骤2-5);否则,直至扫描完HTML代码,返回步骤2-2);
2-4)创建一个点击超链接类型的状态Si,以及一个相应的网址类型的状态Si+1,若状态Si+1不属于网站所有状态集,则将状态Si+1加入网站所有状态集中,并将<a>标签中的超链接的网址加入网址队列,并且在状态Si的行为集添加网页跳转类型行为,并将状态Si+1加入到在状态Si下发生该网页跳转类型行为后可能到达的状态集中,在状态Sj的行为集添加点击超链接类型行为,将状态Si加入到在状态Sj下发生该点击超链接类型行为后可能到达的状态集中,将变量i+2赋值给i,并返回到步骤2-3)继续扫描;以及
2-5)创建一个提交数据类型的状态Si,若状态Si不属于网站所有状态集,则将状态Si加入网站所有状态集,并继续扫描<form>中的子标签,当遇到<input>或<button>,则创建一个点击按钮类型的状态Si+1,并且在状态Si+1的行为集添加提交数据类型行为,将状态Si加入到在状态Si+1下发生该提交数据类型行为后可能到达的状态集中,在状态Sj的行为集添加点击按钮类型行为,将状态Si+1加入到在状态Sj下发生该点击按钮类型行为后可能到达的状态集中,将变量i+2赋值给i,并返回到步骤2-3)继续扫描。
5.根据权利要求4所述的基于HTML的网站行为模型建模方法,其特征在于,所述状态为稳定状态或非稳定状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110121990.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种能快速组合、分解的检波器串
- 下一篇:一种泄压保护装置