[发明专利]文本解析系统及方法无效
申请号: | 200810300125.0 | 申请日: | 2008-01-16 |
公开(公告)号: | CN101488123A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 李忠一;叶建发;卢秋桦;樊晓迪;张晓平 | 申请(专利权)人: | 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518109广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 解析 系统 方法 | ||
1.一种文本解析系统,其特征在于,该系统包括:
载入模块,用于载入文本描述定义文件,及将所需解析的文本载入 到数组中,数组的一个元素对应所需解析的文本的一行,所述的文本描 述定义文件定义文本的各个区块及各个数据的匹配规则,各个区块形成 多层的树状结构,顶层是根区块,底层是最小单位区块,该文本描述定 义文件采用正则表达式描述各个区块及各个数据的匹配规则;
解析模块,用于从根区块开始,在所述数组中根据各个区块的匹配 规则匹配文本的各个区块,若匹配出的区块包含子区块,则根据子区块 的匹配规则在所述匹配出的区块中匹配所述子区块,直到匹配出所有区 块,并且根据相应的数据的匹配规则从各个最小单位区块中提取出各个 数据;及
输出模块,用于将所提取的数据以用户所需的文件格式输出。
2.如权利要求1所述的文本解析系统,其特征在于,所述的文本 描述定义文件是一种可扩展标记语言文件。
3.如权利要求1所述的文本解析系统,其特征在于,所述的输出 模块将所提取的数据以用户所需的文件格式输出是将所提取的数据根据 文本描述定义文件组织为可扩展标记语言文件输出。
4.一种文本解析方法,其特征在于,该方法包括步骤:
建立文本描述定义文件,所述的文本描述定义文件定义各个区块及 各个数据的匹配规则,各个区块形成多层的树状结构,顶层是根区块, 底层是最小单位区块,该文本描述定义文件采用正则表达式描述各个区 块及各个数据的匹配规则;
载入文本描述定义文件,及将所需解析的文本载入到数组中,数组 的一个元素对应所需解析的文本的一行;
从根区块开始,在所述数组中根据各个区块的匹配规则匹配文本的 各个区块,若匹配出的区块包含子区块,则根据子区块的匹配规则在所 述匹配出的区块中匹配所述子区块,直到匹配出所有区块,并且根据相 应的数据的匹配规则从各个最小单位区块中提取出各个数据;及
将所提取的数据以用户所需的文件格式输出。
5.如权利要求4所述的文本解析方法,其特征在于,所述的文本 描述定义文件是一种可扩展标记语言文件。
6.如权利要求4所述的文本解析方法,其特征在于,所述将所提 取的数据以用户所需的文件格式输出是将所提取的数据根据文本描述定 义文件组织为可扩展标记语言文件输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司,未经鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810300125.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无损位图的压缩与解压缩方法
- 下一篇:灌嘴及采用该灌嘴的模具