[发明专利]一种针对Web页面数据的摘要提取方法及检测方法有效
申请号: | 201611234214.0 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106650504B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 史红周;梁英;项定华;段琼琼;刘建飞 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F21/64 | 分类号: | G06F21/64 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 web 页面 数据 摘要 提取 方法 检测 | ||
1.一种针对Web页面数据的摘要提取方法,其中所述Web页面基于其页面布局划分成不同层次,所述方法包括:
1)基于Web页面的输入数据,生成最低层次的摘要;
2)对前一层次的摘要提取摘要,得到当前层次的摘要;
3)重复步骤2),直到生成最高层次的摘要;
4)根据全部层次的摘要,生成所述Web页面数据的Web摘要。
2.根据权利要求1所述的方法,其中所述Web页面基于其页面布局中的单元划分来确定所述不同层次,所述不同层次包括以下至少两个层次:
与页面对应的层次、与域对应的层次、与区对应的层次;
其中,所述与区对应的层次低于所述与域对应的层次,所述与域对应的层次低于所述与页面对应的层次。
3.根据权利要求2所述的方法,其中步骤1)包括:
对Web页面域中的输入数据提取摘要,生成域的摘要。
4.根据权利要求3所述的方法,其中步骤2)包括:
根据所述Web页面的区中所包含的域,对其中的域的摘要提取摘要,生成区的摘要。
5.根据权利要求4所述的方法,其中步骤3)包括:
根据所述Web页面中所包含的区,对其中的区的摘要提取摘要,生成页面的摘要。
6.根据权利要求5所述的方法,其中步骤4)包括:
将生成的所述域的摘要、所述区的摘要、所述页面的摘要拼接成字符串,生成Web摘要。
7.根据权利要求6所述的方法,其中步骤4)还包括:
在所述字符串中设置间隔符,间隔相邻的所述域的摘要和所述区的摘要和/或所述页面的摘要。
8.根据权利要求7所述的方法,其中步骤4)还包括:
在所述字符串中为所述域的摘要和所述区的摘要和所述页面的摘要设置标识字段,以标识所述域和所述区和所述页面之间的层属关系。
9.根据权利要求8所述的方法,其中步骤4)中所述标识字段包括:
所述域的编号及其所属区和/或页面的编号,和
所述区的编号及其所属页面的编号,和
所述页面的编号。
10.一种基于权利要求1-9中任意一项方法,检测Web页面数据变化的方法,包括:
1)获得需要访问的Web页面数据及其相应的Web摘要;
2)采用与生成所述Web摘要相同的方法,对所获得的Web页面数据提取第二摘要;
3)将所述第二摘要与所述Web摘要进行比对,确定所获得的Web页面数据相较于所述输入Web页面的数据是否发生变化。
11.根据权利要求10所述的方法,其中步骤3)包括:
将第二摘要与所述Web摘要中的对应字段进行直接比对:
如不相同,则报告该字段所定位的数据发生异常。
12.根据权利要求11所述的方法,其中步骤3)包括:
将第二摘要与所述Web摘要中的相应字段进行交叉比对:
如所述Web摘要中的字段与所述第二摘要中的非对应字段发生了交换,则报告该两个字段所定位的数据发生顺序错乱。
13.一种检测用户输入Web页面的数据的变化的装置,其中所述Web页面划分成不同层次,所述装置包括:
层次加密上传模块,用于基于Web页面的输入数据,生成最低层次的摘要;以及基于前一层次的摘要,生成当前层次的摘要,直到生成最高层次的摘要;以及根据全部层次的摘要,生成所述Web页面数据的Web摘要;
验证模块,用于对取回的数据提取第二摘要,并比对所述Web摘要与所述第二摘要,以检验取回的所述数据相较于所述输入数据是否发生变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611234214.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:五门衣柜门板(61801‑1)
- 下一篇:一种车辆攻击检测方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置