[发明专利]准备显示文档用于分析的设备无效
申请号: | 200880105360.0 | 申请日: | 2008-08-06 |
公开(公告)号: | CN101796509A | 公开(公告)日: | 2010-08-04 |
发明(设计)人: | 阿德里安·李 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陆军 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 准备 显示 文档 用于 分析 设备 | ||
1.一种准备显示文档用于分析的设备,包括:
提取器,用于从所述显示文档提取字符数据;
顺序识别器,用于确定与所述字符数据的处理相关联的第一顺序、以及与所述字符数据的逻辑顺序相关联的第二顺序,并确定第一顺序与第二顺序是否不同;以及
反转组件,用于响应于该顺序识别器确定所述第一顺序不同于所述第二顺序,反转所述字符数据。
2.如权利要求1所述的设备,其中,所述顺序识别器可操作用于:
确定依赖位置的字符数据;
将所述依赖位置的字符数据与规则相比较;以及
响应于所述比较,确定所述第二顺序。
3.如权利要求2所述的设备,其中,所述依赖位置的字符数据包括标点符号字符和呈现数据中的至少一个。
4.如权利要求1所述的设备,其中,所述顺序识别器可操作用于:
确定所述字符数据中的通常出现的词;
将所述通常出现的词与规则相比较;以及
响应于所述比较,确定第二顺序。
5.如权利要求1所述的设备,其中,所述顺序识别器可操作用于:
将所述字符数据与辞典集合相比较;以及
响应于所述比较,确定第二顺序。
6.如权利要求1所述的设备,还包括语言识别器,用于识别与文档中的所述字符数据相关联的至少一种语言。
7.如权利要求6所述的设备,其中,所述语言识别器可操作用于分析下列的至少一个:与所述字符数据相关联的词汇;与所述字符数据相关联的至少一种字符编码;以及与所述字符数据的脚本相关联的脚本数据。
8.如权利要求6或权利要求7所述的设备,其中,所述顺序识别器可操作用于使用所识别的语言来确定规则,其中将文档中的字符数据与该规则相比较,以便确定所述第二顺序。
9.如权利要求6至8中的任一个所述的设备,其中,所述语言识别器和所述顺序识别器中的至少一个可操作用于:生成分别与所识别的语言和所确定的第二顺序中的至少一个相关联的置信度值。
10.如权利要求9所述的设备,还包括:用于将所述置信度值与置信度阈值相比较的部件。
11.如权利要求1所述的设备,其中反转组件可操作用于:确定文档中的所述字符数据是否具有主要的第一顺序。
12.如权利要求11所述的设备,其中,响应于确定文档中的字符数据具有主要的第一顺序,所述反转组件可操作用于:
确定与第二顺序相关联的数据的至少一个子集;以及
反转所确定的子集。
13.如权利要求11所述的设备,其中,响应于确定文档中的字符数据不具有主要的第一顺序,所述反转组件可操作用于:
反转所述字符数据;响应于反转所述字符数据;
确定与第一顺序相关联的字符数据的至少一个子集;以及
反转所述确定的子集。
14.如权利要求1所述的设备,其中,响应于所述反转组件反转文档中的所述字符数据,文本检索系统、文本分析系统以及文本处理系统中的至少一个可操作用来接收所述字符数据。
15.如权利要求1所述的设备,其中第一顺序与所述字符数据的检索相关联。
16.一种准备显示文档用于分析的方法,包括以下步骤:
从所述显示文档中提取字符数据;
确定与所述字符数据的处理相关联的第一顺序、以及与所述字符数据的逻辑顺序相关联的第二顺序;
确定所述第一顺序是否不同于所述第二顺序;以及
响应于确定所述第一顺序不同于所述第二顺序,反转所述字符数据。
17.如权利要求16所述的方法,还包括以下步骤:
确定依赖位置的字符数据;
将所述依赖位置的字符数据与规则相比较;以及
响应于所述比较,确定所述第二顺序。
18.如权利要求17所述的方法,其中,所述依赖位置的字符数据包括标点符号字符和呈现数据中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880105360.0/1.html,转载请声明来源钻瓜专利网。