[发明专利]数据查询系统及方法无效
申请号: | 200710126036.4 | 申请日: | 2007-06-29 |
公开(公告)号: | CN101082936A | 公开(公告)日: | 2007-12-05 |
发明(设计)人: | 刘丽丽;陆强;游波 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 尚志峰;吴孟秋 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 查询 系统 方法 | ||
技术领域
本发明涉及搜索引擎领域,更具体地涉及一种数据查询系统及方法。
背景技术
搜索引擎系统是一种对信息资源进行搜集,并在对信息进行处理和组织之后,为用户提供信息查询的系统。用户可以输入想要查询的内容,搜索引擎系统根据用户的输入在海量信息中快速准确地定位用户需要的信息,并将搜索结果返回给用户。
目前,搜索引擎在进行用户输入串的查询分析时,一般采取以下几种方式:目录搜索方式,采用系统预置搜索词的方式,用户通过目录分级选择,选择关键词;直接将用户输入作为关键字进行查询;以及将用户的查询结果按照词典进行分词后,将分词结果作为关键字进行查询。
上述几种方式存在以下缺陷:
1)如果由用户选择系统事先预置的关键词,所选择的内容有限,不能满足各种用户需求。
2)如果采取目录方式选择关键词,由于分类众多、关键词众多,用户选择需要的关键词比较费时。
3)如果直接对用户输入关键字进行查询,则要求用户描述特别简洁,清晰。而由于搜索引擎面对的是海量数据,数据的来源众多,结构多样,信息的描述可能与用户输入不尽相同。所以容易造成用户无法得到真正需要的信息,搜索得到的信息相对较少的问题。若用户输入不准确,甚至有可能无法得到搜索结果。
4)如果按照词典进行分词,若用户输入错误,可能造成分词失败,则搜索引擎系统会直接将该词分为单字进行查询,这样搜索结果众多,且多数为垃圾结果,用户无法从这些海量数据中找到自己真正想要的结果。
发明内容
鉴于以上所述的一个或多个问题,本发明提供了一种数据查询系统及方法。
根据本发明的数据查询系统包括:入口模块,用于接收用户欲查询的查询串;分词模块,用于对查询串进行初步分词,判断是否需要对初步分词结果进行同音词搜索,并根据判断结果对初步分词结果进行处理;以及查询模块,用于根据经过处理的最终分词结果进行数据查询。
其中,分词模块包括:中文分词模块,用于根据特定规则对查询串进行初步分词,以及在不需要对初步分词结果进行同音词搜索的情况下,将初步分词结果发送至入口模块;搜索判断模块,用于判断是否需要对初步分词结果进行同音词搜索;以及同音词处理模块,用于在需要对初步分词结果进行同音词搜索的情况下,对初步分词结果进行拼音标注,并根据拼音标注信息对初步分词结果进行同音词搜索。
其中,同音词处理模块包括:拼音标注模块,用于对初步分词结果进行拼音标注;同音词搜索模块,用于根据拼音标注信息在同音词词典中对初步分词结果进行同音词搜索。
其中,查询模块包括:数据查询模块,用于根据初步分词结果或最终分词结果进行数据查询;数据索引模块,用于对需要查询的资料建立索引,并对索引进行维护。
根据本发明的数据查询系统还可以包括:同音词词典模块,用于生成并存储同音词词典,并对同音词词典进行实时更新。
根据本发明的数据查询方法,包括以下步骤:S302,接收用户欲查询的查询串;S304,对查询串进行初步分词,判断是否需要对初步分词结果进行同音词搜索,并根据判断结果对初步分词结果进行处理;以及S306,根据经过处理的最终分词结果进行数据查询。
其中,步骤S304包括以下步骤:S3042-1,对查询串进行初步分词;S3044-1,判断是否需要对初步分词结果进行同音词搜索;S3046-1,在不需要对初步分词结果进行同音词搜索的情况下,直接进行步骤S306。
其中,步骤S304包括以下步骤:S3042-2,对查询串进行初步分词;S3044-2,判断是否需要对初步分词结果进行同音词搜索;S3046-2,在需要对初步分词结果进行同音词搜索的情况下,在同音词词典中对初步分词结果进行同音词搜索,然后进行步骤S306。
其中,在步骤S306中,还对需要查询的资料建立索引,并对索引进行维护。根据本发明的数据查询方法还可以包括以下步骤:生成并存储同音词词典,并对同音词词典进行实时更新。
在本发明中,用户可以通过输入准确、简洁的关键字得到准确率高的结果,并可以通过输入拼音进行搜索。并且在用户输入的信息中出现同音别字或模糊音(如前鼻音、后鼻音等)别字时,本发明可以进行自动纠正,并得到正确的搜索结果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据查询系统的框图;
图2是根据本发明另一实施例的数据查询系统的框图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710126036.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:照明装置及显示装置
- 下一篇:一种整合语音输入和手写输入功能的汉字输入系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置