[发明专利]用于动态生成XQuery的方法和XQuery生成器无效
申请号: | 200810173413.4 | 申请日: | 2008-10-22 |
公开(公告)号: | CN101419613A | 公开(公告)日: | 2009-04-29 |
发明(设计)人: | 扎伊纳布·加茨乌丁·萨依德;阿日俊·本那杰 | 申请(专利权)人: | 软件股份公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 宋 鹤;南 霆 |
地址: | 德国达*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 动态 生成 xquery 方法 生成器 | ||
技术领域
本发明涉及一种用于为存储有多个非XML文档的XML数据库动态生成XQuery的方法和XQuery生成器。
背景技术
XML数据库是现代信息社会的最重要的技术工具之一。这种数据库的高度灵活性允许以高效的方式存储和检索数据。通常,XML数据库设计用于XML文档。然而,在现有技术中还已知的是,扩展XML数据库以使得它能够存储其它类型的文档。例如,申请人的XML数据库Tamino适于存储非XML文档,例如纯文本文件、MS Office文件、PDF文件、图像和音频文件等。为了使得这种非XML文档能够在未来从数据库检索到,已知的是分析要存储的任何非XML文档并且提取元数据,以用于生成对应于非XML文档的所谓XML影像文档。使用XQuery,可在随后搜索这种影像XML文档,并且可检索对应的非XML文档。
因为XQuery最初仅具备有限的文本检索(TR)功能,现有技术中已知的是用附加的TR索引和专用的TR查询引擎来扩展其能力。例如,申请人的“Tamino”XML数据库中的XQuery版本提供有常见TR功能包,像“包含”、“附近”、或“邻近”。
XQuery生成器是用于数据库的工具应用,通常包含在数据管理和审查包中。XQuery生成器通过向用户遮掩查询语言有时复杂的语法和语义来提高用户的生产力。代替地,给用户提供对查询语言的受限制功能进行的支持GUI的访问,使他能够在不懂查询语言的语法和语义的情况下完成其大部分的例行工作。在US 2006/0101002中公开了现有技术的这种XQuery生成器的一个示例。
但是,当搜索大量未知并且未分类的数据,尤其是文本数据时,现有技术的XQuery生成器是不适合的,因为它们仍然要求用户的高级技能。因此本发明在基于该技术问题一个方面中用来便利在这种文档中进行搜索并且同时为用户保持尽可能多的灵活性,以便他可从非XML文档的集合中得到所有期望的信息。
发明内容
在本发明的一个方面中,由根据权利要求1的方法解决该问题。在一个实施例中,提供了一种用于为存储有多个非XML文档的XML数据库动态生成XQuery的方法,每个非XML文档具有在XML数据库中的相应影像XML文档,其中,所述方法包括以下步骤:
-提供XQuery代码的多个静态单元,这些静态单元是根据非XML文档来预定义的。
-组合一个或多个具有来自用户的动态输入的静态单元来生成XQuery。
结果,用户可容易地生成XQuery,其特别适于某组非XML文档(及其相应影像XML文档),这通过灵活地组合特别适合的预定义的静态XQuery代码单元来实现。例如,如果非XML文档是文本文档,预定义的代码单元可包含TR函数,其接着可容易地由用户按需进行组合或调整。
为实现所描述的方法,“数据架构”起先可预定义静态代码单元并接着让用户组合这些单元,并且如果期望的话,甚至为由此得到的查询添加一些自由格式部分。因此这种数据架构可充当在缺乏经验的用户和将由XQuery检索的数据之间的媒介,类似于便利访问图书馆的书的图书管理员。在一个实施例中通过给用户呈现GUI得到来自用户的动态输入,该GUI提供了与一个或多个静态单元相关的一个或多个按钮。
在一个实施例中,在步骤a中提供了一个FLWOR表达式,其包括根据非XML文档来预定义的静态for子句。该for子句表示包含将在其上执行查询的文档的集合和文档类型。在影像XML文档上执行XQuery。
FLWOR表达式可进一步包括根据非XML文档来预定义的静态return子句。该静态return子句可包含关于结果集的相关信息,即相应的ino:id(s)、ino:docname(s)等等。此外,FLWOR表达式可包括一个静态let子句用于声明变量,例如非XML文档的创建时间。最后FLWOR表达式可包括一个where子句,其包括用于XQuery的至少一个动态定义的用户判别式。该where子句不限制为单个判别式而是可包括由布尔操作符组合的多个用户判别式。
在一个实施例中,非XML文档是文本文档,尤其是Microsoft Office文档和/或Adobe PDF文档。每个文本文档可包括预定义文本部分和自由格式文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于软件股份公司,未经软件股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810173413.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:外套式堵漏管头
- 下一篇:撑开式双重密封双闸板平板闸阀