[发明专利]评估XML全文搜索有效
申请号: | 201380058915.1 | 申请日: | 2013-09-26 |
公开(公告)号: | CN104781811B | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 刘振华;吕颖;张辉 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06F16/835 | 分类号: | G06F16/835 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 袁玥 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估 xml 全文 搜索 | ||
提供了用于存储XML文档中的记号的倒排列表并且使用倒排列表处理查询的过程、机器和存储的指令。对于记号在XML文档中的每次出现,文档处理器向针对该记号的列表添加条目。针对该记号的条目把该记号映射到可以找到该记号的文档或文档内的节点。文档处理器还可以检测XML文档中的标志并且,对于标志的每次出现,向针对该标志的列表添加条目。针对标志的条目指定由该标志覆盖的位置范围。然后,查询处理器可以接收用于对照XML文档进行评估的全文查询,并且查询处理器可以使用针对记号的列表和/或针对标志的列表来确定查询的结果集。
技术领域
本发明涉及XML全文搜索。
背景技术
标记数据
应用程序经常把数据存储为带有语境线索(contextual clue)的文本文档,语境线索在文本内提供。通过给文本内的数据值加标志(tag)或加标签(label),可以为数据值提供“语境(context)”。数据值的语境可以由单个标签或诸如标签的层次路径之类的标签组合来提供。在一个示例中,值“Tom”可以以标签“Name”开始。各种标记信号可以用来区分数据值与标签本身。例如,标签可以用诸如“//Name Tom”中的“//”或者诸如“-Name Tom”中的“-”作标记。在许多标记语言中,诸如在“<Name>Tom”中,标签是在尖括号内提供的。数据值的结尾也可以被标记。例如,结尾可以用“</Name>”作标记。结尾还可以由另一个标签的开始作标记,例如“-Name Tom-Age 25”。经标记的数据可以指示层次结构,使得单个数据值落在标签的路径下面,诸如在“<CONTACT><NAME>Tom</NAME></CONTACT>”中,其中“Tom”落在路径“CONTACT/NAME”下面。作为替代,数据值可以用不指定层次路径的个别标签作标记,诸如在“-Name Tom-Age 25”中。可扩展标记语言(XML)是用来为数据提供语境的示例性标记语言。
XML
可扩展标记语言(XML)是用于表示数据的万维网联盟(W3C)标准。许多应用程序被设计为以XML文档的形式输出数据。可以使用各种技术把来自这种XML文档的数据存储到关系数据库中。XML充当可以与本文所述的技术一起使用的示例性标记语言。
XML数据包括形成层次的结构化数据项。在XML中,被称为元素的数据项是由打开标志(opening tag)和关闭标志(closing tag)定界的。元素还可以包括在元素的打开标志中指定的属性。元素的标志之间的文本可以表示任何类型的数据值,诸如串、日期或整数。元素可以具有一个或更多个孩子。XML格式化数据的所产生的层次结构以与用来讨论家族树的术语类似的术语进行讨论。例如,子元素被说成从其父元素或者传下其父亲的任何元素传下来。父元素被说成是其自己的任何子元素的祖先元素或者其后代元素之一的祖先元素。总而言之,元素连同其属性和后代被称为树或子树。
XML查询和XPATH
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380058915.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:结构体的接合位置的优化解析方法以及装置
- 下一篇:电子设备组件堆叠