[发明专利]HTML表格语义脉络分析方法无效
申请号: | 200910272408.3 | 申请日: | 2009-10-20 |
公开(公告)号: | CN102043819A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 尹文生 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | html 表格 语义 脉络 分析 方法 | ||
1.一种HTML表格的语义分析方法,应用于HTML表格的语义脉络分析,特别是网络文档的检索,其特征是:定义表格坐标系并用表格矩阵来记录,定义单元格对象来表示显示单元格,定义列或行组合单元并以列或行组合单元为分析对象,确定表格中属性及其取值的特征,以单元格之间的几何位置关系设定每个属性的作用域及建立属性及其取值的识别规则,通过使用表格矩阵对表格单元格进行遍历,建立所有单元格之间的关系,使相关的单元格之间形成了语义脉络关系。
2.根据权利要求1所述的HTML表格的语义分析方法,其特征是:表格坐标系的坐标取值范围根据HTML中的TABLE标记块的行、列参数确定,表格矩阵是对表格坐标系的记录。
3.根据权利要求1所述的HTML表格的语义分析方法,其特征是:单元格对象是用户在网页上所能看到的内容,是表格坐标系中的一块矩形区域,其范围用表格矩阵描述。
4.根据权利要求1所述的HTML表格的语义分析方法,其特征是:列或行组合单元是按照表格坐标系y或x方向所形成的矩形区域。
5.根据权利要求1所述的HTML表格的语义分析方法,其特征是:表格中属性及其取值是按照列或行组合单元格方式进行的,每个属性的作用域是它下面或右边所有的相等宽度或高度的单元格。
6.根据权利要求1所述的HTML表格的语义分析方法,其特征是:属性单元格的上方或左方没有相同宽度或高度的单元格,在同一个列或行组合单元格中不同的属性具有不同的宽度或高度。
7.根据权利要求1所述的HTML表格的语义分析方法,其特征是:两个相邻的不同属性之间存在父子关系,上面或左边的属性为下面或右边属性的父属性。
8.根据权利要求1所述的HTML表格的语义分析方法,其特征是:在对表格坐标系进行遍历时通过单元格之间的坐标关系确定相对几何位置和大小关系,进而确定单元格之间的父子关系,形成一个表格内容树。
9.根据权利要求8所述的HTML表格的语义分析方法,其特征是:表格内容树表达了表格中包含的语义关系,其中任意一条从根节点到叶结点的路径表达了表格的一个语义脉络,当用户输入的查询语义脉络与之匹配时表格所属文档即是用户所需要检索的文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910272408.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:公司与顾客间的服务提供方法
- 下一篇:一种中医内科叩诊装置