[发明专利]将样式破坏从可扩展标记语言文档中移除有效
申请号: | 201110285395.0 | 申请日: | 2011-09-07 |
公开(公告)号: | CN102360350A | 公开(公告)日: | 2012-02-22 |
发明(设计)人: | S·贡多罗夫 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 罗婷婷 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样式 破坏 扩展 标记 语言 文档 | ||
技术领域
本发明涉及将不正确的文件内容从可扩展标记语言文档中移除的方法和计算设备。
背景技术
可扩展标记语言(XML)是用于以机器可读的形式来编码电子文档以获得因特网上的简单性、通用性和可用性的一组标准化规则。尽管对该文本数据格式的设计聚焦于文档,但是例如在web服务中它被广泛使用来表示任意数据结构。具有XML的各种版本和变型。XML类型的一个示例是由华盛顿州雷蒙德市的微软公司开发的标准化Office Open XML(OOXML)文件格式。OOXML包括可用来表示电子office文档的一组文件格式。该格式为文字处理文档、电子表格和演示文稿定义了一组XML标记词汇,并为诸如数学公式、图形、参考书目和类似内容等内容定义了具体的XML标记词汇。该标准化OOXML格式旨在通过使得经由多个创建者的以及在多个平台上的实现成为可能来便于可扩展性和互操作性。
通常被称为“样式表”的样式定义文档部分是将演示文稿与在用于存储及将格式化应用于文本的文档处理程序中的内容分开的表单。各个样式可作为默认样式而被包括在文档模板内,或者可由用户使用指示了如何来对数据的所选部分进行格式化的各种命令来创建。样式表有助于使发布物保持一致性,使得诸如正文、标题、脚注、页码格式、字体颜色、背景颜色等常见元素始终都看起来是相同的。样式表也节省了时间,它允许作者在一个操作中就将格式应用于所选的各个元素,而不是将格式一次应用于一个元素。
当在文档中使用定制样式定义时,具有破坏文件内容的潜在可能。在某些场景中,当内容是从多个文档复制而来的时,具有定制样式可由于与文档结构有关的各种原因而导致文件破坏。OOXML分组是包含XML文档或诸如与文档有关的样式定义等其他资源的经压缩(或可压缩)分组。OOXML分组的内容可由应用程序或工具来访问,而不必激活用来编辑文档本身的应用程序。
发明内容
提供本发明内容以便以简化的形式介绍将在以下的具体实施方式中进一步描述的一些发明内容。本概述并不旨在专门标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
各实施例旨在从基于XML的文档文件中移除未被使用的、重复的或被破坏的样式。该移除可使用系统输入输出来涉及文档的定制样式部分,并且该移除基于对在相应文档文件的可压缩分组中包含的信息的分析。也可使用相同的方法来将诸如被破坏的名称范围或未被使用的值格式定义等其他不正确的文件内容移除。
通过阅读以下的详细描述并参考相关的附图,这些及其它特征和优点将变得显而易见。可以理解,前述一般描述和以下的详细描述都是说明性的,并且不限制所要求保护的各方面。
附图说明
图1是示出了本地和远程破坏移除算法的示例的图示。
图2示出了显示有破坏移除算法的主要组件的系统图示;
图3示出了在破坏移除算法内的各个模块;
图4示出了在概念上将被破坏的样式定义从XML文档移除;
图5是可实现根据各实施例的系统的联网环境;
图6是可实现各实施例的示例性计算操作环境的框图;以及
图7示出了根据各实施例的在XML文档中移除被破坏的样式的过程的逻辑流程图。
具体实施方式
如之前简要描述地,可使用系统输入输出组件来将未被使用的、重复的或被破坏的样式从XML文件的样式部分中移除。对在XML分组部分内包含的信息的分析可指导对被破坏部分的移除。也可移除其他不正确的文件内容。在以下的详细描述中,参考了构成详细描述的一部分并作为说明示出各具体实施例或示例的附图。可以组合这些方面,可以利用其它方面,并且可以在不背离本发明的精神或范围的前提下做出结构上的改变。因此,以下详细描述并不旨在限制,并且本发明的范围由所附权限要求及其等效方案来定义。
尽管在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文中描述了各实施方式,但是本领域的技术人员会认识到各方面也可以结合其它程序模块实现。
一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。此外,本领域的技术人员可以明白,各实施例可以用其它计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费者电子产品、小型计算机、大型计算机以及类似计算设备。各实施例还可以在任务由通过通信网络链接的远程处理设备来执行的分布式计算环境中实现。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110285395.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锻件的夹装治具
- 下一篇:船坞内船舶二次落墩定位装置