[发明专利]一种基于关键词的WEB服务器扩展检索方法有效
申请号: | 201110089889.1 | 申请日: | 2011-04-11 |
公开(公告)号: | CN102110174A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | 叶蕾;邹国奇;刘春伟 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 张先芸 |
地址: | 400044 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 web 服务器 扩展 检索 方法 | ||
1.一种基于关键词的WEB服务器扩展检索方法,其特征在于,包括如下步骤:
1)在WEB服务器的检索请求解析程序与搜索引擎之间设置关键词扩展程序;所述关键词扩展程序由扩展信息注册线程、扩展条件生成线程、扩展信息解析线程以及关联词映射表、拼音汉字映射表、英汉对照映射表、同义词映射表、错别字映射别和缩写词映射表组成;
2)通过扩展信息注册线程,将关联词对应关系、拼音与汉字对应关系、英文与汉字对应关系、同义词对应关系、错别字对应关系和缩写词对应关系分别存入或更新到关联词映射表、拼音汉字映射表、英汉对照映射表、同义词映射表、错别字映射别和缩写词映射表中;
3)当WEB服务器收到来自客户端的检索请求时,检索请求解析程序解析检索请求获得检索的关键词以及扩展条件选项,所述扩展条件选项用于指定关联词映射表、拼音汉字映射表、英汉对照映射表、同义词映射表、错别字映射别、缩写词映射表中的一项或几项映射表作为扩展条件;扩展条件生成线程将扩展条件选项所选择各项映射表生成为一份扩展条件映射总表;扩展信息解析线程查询扩展条件映射总表中的各项映射表,获得与关键词相对应的扩展词;搜索引擎则根据检索请求解析程序解析获得的关键词以及扩展信息解析线程查询获得的对应的扩展词检索信息文本数据库,获得分别与关键词及其对应的扩展词相匹配的各项检索结果,并将所述检索结果返回至发送检索请求的客户端。
2.根据权利要求1所述的基于关键词的WEB服务器扩展检索方法,其特征在于:所述关联词对应关系,是针对一个候选词,建立一个包含该候选词的文本库,通过基于广义jaccard系数的相似度算法从所述文本库中计算与该候选词相关度,取相关度排列前三的三个词作为与该候选词对应的关联词;由此获得关联词对应关系。
3.根据权利要求1所述的基于关键词的WEB服务器扩展检索方法,其特征在于:所述拼音与汉字对应关系根据汉语词典获得。
4.根据权利要求1所述的基于关键词的WEB服务器扩展检索方法,其特征在于:所述英文与汉字对应关系根据英汉对照词典获得。
5.根据权利要求1所述的基于关键词的WEB服务器扩展检索方法,其特征在于:所述同义词对应关系根据同义词词典获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110089889.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种永磁直线同步电机仿真方法
- 下一篇:备份、恢复多业务数据库的方法及装置