[发明专利]利用词组索引技术对基于关键词索引的搜索引擎进行改进的方法无效
申请号: | 200710143023.8 | 申请日: | 2007-08-21 |
公开(公告)号: | CN101201838A | 公开(公告)日: | 2008-06-18 |
发明(设计)人: | 邓剑波;戴云川;詹天荣;张潘;高潮;周波;张森;胡显如 | 申请(专利权)人: | 新百丽鞋业(深圳)有限公司;邓亚丽 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518033广东省深圳市福田中心区福华一*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明利用词组索引技术对基于关键词索引的搜索引擎进行改进的方法,在获得用户提交的用户查询以后,首先对查询进行预处理,然后分别独立送给查询分析模块和搜索引擎接口与网页数据处理模块,分别由查询分析模块完成查询的词组生成工作;由搜索引擎接口与网页数据处理模块完成从传统搜索引擎中获取网页数据,进行网页文本数据处理,进而生成倒排表的工作;然后通过检索排序模块将查询分析模块生成的词组在搜索引擎接口与网页数据处理模块获得的倒排表里进行检索匹配,并在搜索引擎给出的原排序基础上,根据词组匹配程度,对原排序进行调整,最后将最终结果返回到用户端,同时可以给出网页的自动摘要;本发明具有更高的排序科学性。 | ||
搜索关键词: | 利用 词组 索引 技术 基于 关键词 搜索引擎 进行 改进 方法 | ||
【主权项】:
1.一种利用词组索引技术对基于关键词索引的搜索引擎进行改进的方法,其特征在于:在获得用户提交的用户查询以后,首先对查询进行预处理,主要完成联想和问句处理工作:一、对查询进行联想,获得更精准的查询表述;二、如果用户的原始查询是问句,则利用问句模式匹配程序,将问句转换为陈述句;然后将预处理后的查询,分别独立送给查询分析模块和搜索引擎接口与网页数据处理模块,分别由查询分析模块完成查询的词组生成工作;由搜索引擎接口与网页数据处理模块完成从传统搜索引擎中获取网页数据,进行网页文本数据处理,进而生成倒排表的工作;然后通过检索排序模块将查询分析模块生成的词组在搜索引擎接口与网页数据处理模块获得的倒排表里进行检索匹配,并在搜索引擎给出的原排序基础上,根据词组匹配程度,对原排序进行调整,最后将最终结果返回到用户端,同时可以给出网页的自动摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新百丽鞋业(深圳)有限公司;邓亚丽,未经新百丽鞋业(深圳)有限公司;邓亚丽许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710143023.8/,转载请声明来源钻瓜专利网。