[发明专利]一种基于XML的流式分页发布方法及系统有效
申请号: | 201310484727.7 | 申请日: | 2013-10-16 |
公开(公告)号: | CN103544262B | 公开(公告)日: | 2017-01-11 |
发明(设计)人: | 王冬雪;麻锐;孟利民;王辉;张标标 | 申请(专利权)人: | 银江股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310012 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 xml 分页 发布 方法 系统 | ||
技术领域
本发明涉及一种基于XML的分页发布方法及系统。
背景技术
随着信息技术的飞速发展,越来越多的企事业单位都需要操作海量数据,如医院的医疗数据、交通局的交通数据,电业局的电力数据、规划局的规划数据,水利局的水文、水利数据,气象局的气象数据,这些数据往往是以XML的形式存储在服务器中,用户只需要访问服务器上的文档便可以实现数据的获取。但是,当用户通过PC、手持设备、智能手机等不同的终端设备对服务器上的文档进行访问时,由于终端显示格式、软件系统存储与读取格式的不同,要想正确接收并显示数据,就必须对服务器上的文档进行格式转换。目前,XML文档格式转换工具主要包括:DOM、SAX和XSLT,其中,XSLT作为现在最流行的XML文档格式转换技术之一,功能十分强大,工作原理却比较简单,如图1所示。
由于在转换的过程中,首先需要将XML源文档解析成DOM树存放在内存中,文档过大势必会造成内存的溢出。因此,用户在使用PC、手持设备、智能手机等终端设备读取大数据的过程中,往往会因内存不足或显示屏尺寸过小而无法正确接收和显示数据。
又因为传统的分页处理过程只是实现了分段处理器的功能,即,对输入文档进行迭代式的分段处理,所以得到的所有小XML文档都是非“形式良好”的,使得下一步的转换操作不具备相对独立性,可靠性和容错性也较差,另外迭代的处理方式还大大地降低了分段处理的速度。
发明内容
为了克服已有基于XML的分页发布方法及系统的不能适用于XML文档过大,和转换可靠性、容错性、灵活性、适用性要求较高的场合的不足,本发明提供了一种适用于XML文档过大、转换可靠性、容错性、灵活性、适用性要求较高的场合下的基于XML的流式分页发布方法及系统。
本发明解决其技术问题所采用的技术方案是:
一种基于XML的流式分页发布方法,所述发布方法包括以下步骤:
(1)流化处理过程:
对于每个大型的XML输入文档,流化处理器先要对其大小进行判断,如果文档大小不超过预先设定的分段读取阈值,即Ts≤Tm,那么进入步骤(2)处理;反之,如果文档大小超过预先设定的分段读取阈值,即Ts>Tm,那么流化处理器将对该文档进行分段和重构处理,处理后将生成两个形式良好的XML文档,一个大小等于Tm,另一个大小等于Ts-Tm,前者将被送入步骤(2)处理,而后者将被送往流化处理器进行再一次地判断、分段和重构处理;
(2)快速分页处理过程:
若XML文档Fs0,1的大小远远超过终端设备的需求内存T,即Ts0,1>>T,则对XML文档Fs0,1进行第一轮的分割和重构处理,生成两个“形式良好”的新XML文档Fs1,1和Fs1,2;接下来再对新生成的两个文档Fs1,1和Fs1,2进行判断和第二轮的分割和重构处理,即,若两个新生成的文档Fs1,1和Fs1,2仍满足分割条件:Ts1,1>>T且Ts1,2>>T,则应同时对这两个文档进行分割和重构处理,生成四个“形式良好”文档Fs2,1、Fs2,2、Fs2,3和Fs2,4,依此类推,反复地判断、分割和重构,直到某一轮分割生成的所有XML文档的大小均不超过终端设备的需求内存,分割和重构处理过程结束;
(3)XSLT转换过程:对照终端设备提供的转换样式表,将输入文档转换成其它标准格式的文档输出;
(4)发布过程:将具有不同标准格式的文档发送给相应的终端设备。
进一步,所述步骤(1)中,流化处理过程包括分段处理过程和重构处理过程,所述分段处理过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银江股份有限公司,未经银江股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310484727.7/2.html,转载请声明来源钻瓜专利网。