[发明专利]基于有序小枝模式的航空物流XML报文并行过滤方法有效
申请号: | 201910249408.5 | 申请日: | 2019-03-29 |
公开(公告)号: | CN109977270B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 李国;庄波;李永华 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F16/835 | 分类号: | G06F16/835;G06F9/50 |
代理公司: | 天津市鼎和专利商标代理有限公司 12101 | 代理人: | 蒙建军 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 有序 小枝 模式 航空 物流 xml 报文 并行 过滤 方法 | ||
本发明涉及一种基于有序小枝模式的航空物流XML报文并行过滤方法,属于航空物流XML报文技术领域,其特征在于:包括:一:XPath使用路径表达式来选取XML文档中的节点或者节点集;二:XML文档与小枝模式查询进行标签序列化得到标签序列;三:XPath订阅表达式首先被传递到系统中,然后将XPath表达式通过XPath解析器解析成Prüfer序列,任务组调度算法将根据Prüfer序列计算每个查询序列的任务耗时,并根据任务耗时将所有任务平均分配到各个线程上;四:任务组调度算法中FiST算法通过判断LPS(Q)是否为LPS(T)的子序列,来验证查询树Q与XML文档树T的匹配。
技术领域
本发明属于航空物流XML报文技术领域,具体涉及一种基于有序小枝模式的航空物流XML报文并行过滤方法。
背景技术
随着航空物流业的不断发展,航空公司、代理人、机场货站以及海关等诸多部门需要频繁的进行数据的交换,各个航空物流企业都有自己的信息管理系统,2015年中国民用航空局发布了航空货运电子数据规范,详细制定了XML报文的格式、内容等信息。针对航空物流发布/订阅系统中,订阅者的数量不断的增多,如何高效的将发布的报文准确及时的分发给订阅者是发布/订阅系统的核心问题,因此设计开发一种高效的基于有序小枝模式的航空物流XML报文并行过滤方法显得是至关重要。
发明内容
本发明为解决公知技术中存在的技术问题而提供一种基于有序小枝模式的航空物流XML报文并行过滤方法;其针对发布/订阅订阅系统中订阅者的数量不断的增多特点,本发明的方法能在多核CPU并行查询处理中利用FiST算法的整体性匹配的优点,可以有效避免对有序小枝模式查询的分解,使每个核心可以独立的处理查询结果,不需要后期对查询结果的链接处理。该方法利用任务组调度算法对查询序列集合进行任务划分,将划分后的任务分配到各个CPU核心上执行FiST算法。在处理大量有序小枝模式查询的情况下,本发明可以有效提高XML报文的并行过滤效率。
本发明的目的是提供一种基于有序小枝模式的航空物流XML报文并行过滤方法,包括:
步骤一:XPath(XML Path Language)使用路径表达式来选取XML文档中的节点或者节点集。带谓词的XPath路径表达式被表示成树的形式,也称为小枝模式。由于应用很少涉及到所有的特征,所以讨论基本上都集中在XPath的子集上,定位步骤集合为:{/a,//a,/*,//*,[]},谓词主要讨论等值谓词。
步骤二:XML文档与小枝模式查询进行标签序列化得到标签序列简称LPS(LabelPr üfer Sequence)。为了将小枝模式查询中节点之间的信息包含在标签序列(LPS)中,FiST(Scalable XML Document Filtering by Sequencing Twig Patterns)算法对标签序列(LPS)进行属性扩充。扩充后的序列为查询序列,包含小枝模式中的所有信息。
步骤三:并行过滤方法的系统体系结构,系统在处理XML数据流之前,XPath订阅表达式首先被传递到系统中,然后将XPath表达式通过XPath解析器解析成Prüfer序列,任务组调度算法将根据Prüfer序列计算每个查询序列的任务耗时,并根据任务耗时将所有任务平均分配到各个线程上,使每个线程的任务达到负载平衡,并且为每个线程分配一个CPU核心。FiST算法在各CPU核心上执行查询处理,将匹配结果直接分发给订阅者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910249408.5/2.html,转载请声明来源钻瓜专利网。