[发明专利]文档分析与关联系统及方法无效
申请号: | 201080049493.8 | 申请日: | 2010-09-24 |
公开(公告)号: | CN102597991A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 哈米什·奥格尔维;欧文·詹姆斯·普莱姆;菲利普·安东尼·伯恩斯 | 申请(专利权)人: | 哈米什·奥格尔维;欧文·詹姆斯·普莱姆;菲利普·安东尼·伯恩斯 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06F17/40;G06Q90/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 苏蕾;李冬梅 |
地址: | 澳大利亚新*** | 国省代码: | 澳大利亚;AU |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 分析 关联 系统 方法 | ||
1.一种用于对多个文档进行标引的方法,每个文档包括一个文本部分,该方法包括:
a)解析该多个文档各自的文本部分以形成多个对应的本地文档索引,每个索引与一个对应的文档相关联,并且在一个数据库中存储本地文档索引,其中每个本地文档索引包括包含在该对应文档中的多个本地文本术语以及与每个文本术语相关联的一个本地权重;以及
b)从该多个本地文档索引中形成包括包含在该多个文档中的多个全局文本术语的一个全局文档索引以及一个与每个全局文本术语相关联的全局权重;
其中与这些全局文本术语中的每一个相关联的全局权重是相对于与一个参考全局文本术语相关联的参数所确定的。
2.如权利要求1所述的方法,其中与这些全局文本术语中的每一个相关联的全局权重是进一步相对于其中的每个全局文本术语出现在所有多个文档中的文档的数目所确定的。
3.如权利要求1或权利要求2所述的方法,其中与这些全局文本术语中的每一个相关联的全局权重是相对于该参考文本术语在其中出现的文档的数目所确定的。
4.如权利要求1至3中任意一项所述的方法,其中与这些全局文本术语中的每一个相关联的全局权重是进一步相对于用户交互所确定的。
5.如权利要求4所述的方法,其中与每个文本术语相关联的权重包括多个权重的组合,其中每个权重与每个全局文本术语相关联。
6.如权利要求5所述的方法,其中一个或多个权重是选自下组,该组的构成为:术语在一个单个文档中出现的次数;术语在所有多个文档中出现的次数;文本术语在一个文档中的位置;术语的大写;术语周围的标点符号;临近术语的文本部分中的单词;单词罕见度;单词序列;文本术语的组合;或在每个文本术语中的单词的数目;或用户定义的权重。
7.如权利要求5或权利要求6中任意一项所述的方法,其中该权重可以一个正权重或一个负权重,或选自一个权重范围从正到负的刻度尺。
8.如权利要求7所述的方法,其中该多个权重中的一个或多个是用于一个所选全局文本术语的负权重,为该所选全局文本术语分配了一个零权重。
9.如权利要求6所述的方法,其中该用户定义的权重来源于一个自学习系统,该系统包括用于一个所选全局文本术语的多个用户定义的权重。
10.一种对多个文档进行标引的系统,每个文档包括一个文本部分,该系统包括:
一个解析模块,该解析模块用于解析该多个文档各自的文本部分以形成多个对应的本地文档索引,每个索引与一个对应的文档相关联,其中每个本地文档索引包括包含在该对应文档中的多个本地文本术语以及与每个文本术语相关联的一个本地权重;
一个数据库,该数据库被适配为在一个存储器中存储这些本地文档索引中的每一个;
一个处理器,该处理器用于分析该多个本地文档索引并且从该多个本地文档索引中形成一个全局文档索引,该全局文档索引包括包含在该多个文档中的多个全局文本术语以及与每个全局文本术语相关联的一个全局权重;其中与这些全局文本术语中的每一个相关联的全局权重是相对于与一个参考全局文本术语相关联的参数所确定的;并且其中该全局文档索引存储在该数据库中并且与这些本地文档索引中的每一个有关。
11.一种分析文本部分并且检索与该文本部分相关的文档的方法,该方法包括:
a)接收包括一个输入文本部分的一个输入;
b)识别在该文本部分中的至少一个文本术语;
c)分配与该至少一个文本术语相关联的至少一个权重;
d)形成该至少一个文本术语的一个输入本地索引以及至少一个相关联的本地术语权重,其中该至少一个相关联的本地术语权重是参考在一个数据库存储的一个全局术语索引所确定的,该全局术语索引包括多个全局文本术语以及多个相关联的全局文本术语权重并且从多个参考文档中形成,其中这些参考文档中的每一个的一个图示存储在该数据库中;
e)查询该数据库以识别与该输入文本部分相关的这些参考文档的一个或多个;以及
f)输出所识别的相关参考文档的一个图示。
12.如权利要求11所述的方法,其中存储在该数据库中的多个参考文档中的每一个的图示包括或该参考文档或到其的一个链接,并且该图示进一步包括用于每个参考文档的一个对应的本地参考术语索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈米什·奥格尔维;欧文·詹姆斯·普莱姆;菲利普·安东尼·伯恩斯,未经哈米什·奥格尔维;欧文·詹姆斯·普莱姆;菲利普·安东尼·伯恩斯许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080049493.8/1.html,转载请声明来源钻瓜专利网。