[发明专利]全文查询和搜索系统及其使用方法无效
申请号: | 200580044686.3 | 申请日: | 2005-10-25 |
公开(公告)号: | CN101088082A | 公开(公告)日: | 2007-12-12 |
发明(设计)人: | 唐元华;胡前进;杨永红 | 申请(专利权)人: | 英孚威尔公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00 |
代理公司: | 上海智信专利代理有限公司 | 代理人: | 薛琦 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种用于对基于文本的数据库进行文本搜索的方法,包括了对于编纂的互联网内容、科学文献、书本和文章的摘要、报纸、期刊和诸如此类的数据库。特别是,该算法支持使用全文或网页作为查询和关键词搜索的搜索,它允许多条目的数据库、以信息内容为基础的评级系统(Shannon信息值),其中使用p-值来代表来自随机匹配的命中可能性。而且,用户可以具体指定参数,根据短语匹配和句子相似性,来确定命中和其评级。 | ||
搜索关键词: | 全文 查询 搜索 系统 及其 使用方法 | ||
【主权项】:
1、一个用于搜索和评级文本信息的计算机化储存和检索系统,包含:输入和储存数据作为一个数据库的装置;显示数据的装置;执行文本的自动分析的一个可编程中央处理单元。在此分析的是文本,该文本从含有全文作为查询、网页作为查询的集合中挑出,根据查询和命中之间共有单词的Shannon信息评分值来对命中评级,评级命中根据p-值,计算出的Shannon信息评分值或以单词频率为基础的p-值,该单词频率已经专门为该数据库直接计算出或从至少一个外部来源估计出,共有信息元的百分比本身,查询和命中之间共有信息元的Shannon信息评分值,共有信息元的p-值,共有信息元的百分比本身,计算出的Shannon信息评分值或以信息元频率为基础的p-值,该信息元频率已经专门为该数据库直接计算出或从至少一个外部来源估计出,并且在此文本含有至少一个单词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英孚威尔公司,未经英孚威尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200580044686.3/,转载请声明来源钻瓜专利网。