[发明专利]全文查询和搜索系统及其使用方法无效
申请号: | 200580044686.3 | 申请日: | 2005-10-25 |
公开(公告)号: | CN101088082A | 公开(公告)日: | 2007-12-12 |
发明(设计)人: | 唐元华;胡前进;杨永红 | 申请(专利权)人: | 英孚威尔公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00 |
代理公司: | 上海智信专利代理有限公司 | 代理人: | 薛琦 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全文 查询 搜索 系统 及其 使用方法 | ||
1、一个用于搜索和评级文本信息的计算机化储存和检索系统,包含:输入和储存数据作为一个数据库的装置;显示数据的装置;执行文本的自动分析的一个可编程中央处理单元。在此分析的是文本,该文本从含有全文作为查询、网页作为查询的集合中挑出,根据查询和命中之间共有单词的Shannon信息评分值来对命中评级,评级命中根据p-值,计算出的Shannon信息评分值或以单词频率为基础的p-值,该单词频率已经专门为该数据库直接计算出或从至少一个外部来源估计出,共有信息元的百分比本身,查询和命中之间共有信息元的Shannon信息评分值,共有信息元的p-值,共有信息元的百分比本身,计算出的Shannon信息评分值或以信息元频率为基础的p-值,该信息元频率已经专门为该数据库直接计算出或从至少一个外部来源估计出,并且在此文本含有至少一个单词。
2、根据权利要求1所述的系统,其中文本含有多个单词。
3、根据权利要求1所述的系统,其中查询包含的文本的单词数从含有1-14,15-20,20-40,40-60,60-80,80-100,100-200,200-300,300-500,500-750,750-1000,1000-2000,2000-4000,4000-7500,7500-10000,10000-20000,20000-40000,以及超过40000个单词的集合中挑选出。
4、根据权利要求1所述的系统,其中文本至少含有一个短语。
5、根据权利要求1所述的系统,其中文本被加密。
6、根据权利要求1所述的系统,其中自动分析进一步允许在查询中有重复的信息元并给每个重复的信息元分配较高评分值。
7、根据权利要求1所述的系统,其中自动分析评级是以p-值为基础,该p-值是一个命中对查询的共有信息元的可能性或概率的度量,其中该p-值根据在数据库中信息元的分布来计算出,或者,其中该p-值根据在数据库中信息元的估计分布来计算出。
8、根据权利要求1所述的系统,其中对命中的自动分析评级是以Shannon信息评分值为基础的,其中该Shannon信息评分值是查询和命中的共有信息元的累积Shannon信息。
9、根据权利要求1所述的系统,其中对命中的自动分析评级是以百分比本身为基础的,其中百分比本身是比率:2*(共有信息元)/(在查询和命中中的信息元总数)。
10、根据权利要求6所述的系统,其中计数查询和命中中的信息元在词干溯源之前执行。
11、根据权利要求6所述的系统,其中计数查询和命中中的信息元在词干溯源之后执行。
12、根据权利要求6所述的系统,其中计数查询和命中中的信息元在移走普通单词之前执行。
13、根据权利要求6所述的系统,其中计数查询和命中中的信息元在移走普通单词之后执行。
14、根据权利要求1所述的系统,其中对命中的评级是以累计评分值为基础的,该累计评分值从含有p-值、Shannon信息评分值、以及百分比本身的集合中挑出。
15、根据权利要求14所述的系统,其中自动分析为每个匹配的单词分配一个固定的评分值,为每个匹配的短语分配一个固定的评分值。
16、根据权利要求1所述的系统,其中该算法进一步包含在可视显示装置上以命中文本表达查询文本的装置,其中该共有的信息元被强调表示出来。
17、根据权利要求1所述的系统,其中该数据库进一步包含一个单词和短语的同义词列表。
18、根据权利要求1所述的系统,其中该算法进一步允许用户向数据库输入同义词,该同义词和与其相关的查询词共同包括在分析中。
19、根据权利要求1所述的系统,其中该算法接受文本作为查询而不要求用一个关键词,其中该文本从含有摘要、标题、句子、论文、文章、以及它们的任何部分的集合中挑出。
20、根据权利要求1所述的系统,其中该算法接受文本作为查询而不要求用一个关键词,其中该文本从含有一个网页、一个网页的URL地址、网页的一个被强调部分、以及它们的任何部分的集合中挑出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英孚威尔公司,未经英孚威尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580044686.3/1.html,转载请声明来源钻瓜专利网。