[发明专利]用于选择、分析以及将相关数据库记录可视化为网络的方法和设备有效
申请号: | 200580021670.0 | 申请日: | 2005-05-03 |
公开(公告)号: | CN101084496A | 公开(公告)日: | 2007-12-05 |
发明(设计)人: | 拉尔夫·W·埃卡特;小罗伯特·G·沃尔夫;亚历山大·夏皮罗;凯文·G·里韦特;马克·F·布莱克希尔 | 申请(专利权)人: | 波士顿咨询集团公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 董莘 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 选择 分析 以及 相关 数据库 记录 可视 化为 网络 方法 设备 | ||
相关申请的交叉引用
本发明要求2004年5月4日申请的美国临时专利申请序列号No.60/567,997的优先权,其全部内容在此结合作为参考。
技术领域
本发明一般涉及数据挖掘和分析领域。更为特别地,本发明涉及以网络图形表示表示相关数据库记录的方法和系统。
背景技术
“信息时代”和“知识经济”不过是通常用于描述我们的时代的数字信息爆炸特征的两个术语。无论你如何称呼它,毫无疑问的是被创造出的信息量正以史无前例的速度增长。已经有许多用于量化新知识发展的速度的尝试并已产生有关其爆炸性增长的各种各样的估计。各种各样的来源描述并试图量化这种信息爆炸。经常引用的几个这种统计的例子有:
●通常每5~10年总的人类的知识增加一倍;
●通常每3~5年科学知识增加一倍;
●通常每2~8年医学知识增加一倍;
●在过去的7年内公布的美国专利的数量大约增加了一倍;
●每天大约有1,500,000个网页增加到环球网;
●1999年内数字化存储的原始内容的世界常量需要大约635,000~2,100,000兆千兆字节以存储。
不管这些估计的可靠性如何,它们都指出了新的信息的不可否认的爆炸性增长。计算机技术使得易于创建和存储新的信息。用于存储 这些信息的数据库的数量和规模正在爆炸性地增长。
尽管可用信息的快速增长,人类消化吸收和理解信息的思维能力并没有显著提高。可用信息的迅速增长和我们不能消化吸收它导致信息超负荷。信息的大量存储使得越来越难于找到正确的信息而且甚至于更加难于理解巨大数量的可用的新知识。
知识经济内的工作者工作在充满信息但却不能提取出理解的环境中。这些工作者经常需要寻找并理解有关特定主题或感兴趣的领域的信息以便能够提高他们的行为和/或决策。然而,尽管信息的可用性能够传达信息给他们并提高他们的决策,却没有寻找或消化吸收它的实用方式。
为数众多的公司已投入巨资以帮助信息工作者在他们正搜索的大量数据“大海”中查找信息“针”。用于信息检索的主要范例可称为“搜索和筛选”。“搜索和筛选”方法总是以返回大量匹配的搜索结果的逻辑搜索开始。搜索者然后在结果之内筛选以找到他们寻找的信息。因特网用户和其它大型数据库的用户可能对这种方法非常熟悉。
信息检索领域的大多数投资集中于改进“搜索和筛选”处理。改进的例子包括:
●查询精炼-查询精炼试图确定搜索者的查询背后的意图并精炼查询以便捕获更多与搜索有关的文档或者从结果集中排除更多的无关文档。查询精炼的一个例子是“同义词扩展”,其中查询项被扩充以包括搜索项的同义词以期捕获更多的相关文档。
●结果排序-改进“搜索和筛选”方法的第二种方法是结果排序。结果排序试图基于搜索结果与搜索者意图的相关性排列搜索结果。相关性排序已经以各种方法进行估算,包括:搜索项的使用频率,搜索项在文档内的位置,以及察觉到的结果集内的文档的“重要性/有用性”。结果分类的最佳实例也许就是Google的基于链接到搜索结果页面的其它网页的数量的页面排序度量。
●结果过滤-改进“搜索和筛选”方法的最后一个方法的例子是结果过滤。结果过滤试图基于某种分类方案分类结果集内的文档。其 希望是这将允许搜索者缩小他/她的“筛选”到最为接近与感兴趣的领域有关的结果集的子集。结果过滤的例子包括:Northern Light的“results folders”(参见,例如图1),其基于文档分类的固定分类法。Vivisimo的文档群集工具,其基于文档的语义内容将文档分类为分层树形结构(参见,例如图2),以及Grokker,其类似于Vivisimo将文档分类为动态分层结构,并还利用其的“冒泡显示”提供每个分类的相对大小的可视显示(参见,例如图3)。
所有这些方法都是对“搜索和筛选”方法有用的改进,然而,他们都假定一种特定类型的信息需求,即搜索者正在寻找特定的信息块(PIECE),并且被查找的信息能够在结果集中的文档之内被找到。这种类型的信息检索目标在于发现问题的答案,例如:
●谁杀了Bobby Kennedy?
●世界上第二高的山是什么?
●Palo Alto,CA明天的天气预报是什么?
●IBM的当前股票价格?
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于波士顿咨询集团公司,未经波士顿咨询集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580021670.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:石英传感器和感知装置
- 下一篇:调压器静特性检测系统