[发明专利]一种互联网搜索引擎的搜索方法无效
申请号: | 200710178075.9 | 申请日: | 2007-11-26 |
公开(公告)号: | CN101271464A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 王双;吴爱华;苗宇枫;谌谦;李建锋;徐光美;吴柏林 | 申请(专利权)人: | 北京九城网络软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京双收知识产权代理有限公司 | 代理人: | 解政文 |
地址: | 100070北京市丰*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种互联网搜索引擎的搜索方法,该方法通过含由下载器,产品知识库服务器,产品网页数据服务器,分词器和索引器,索引数据库,查询器组成的搜索系统,执行产品数据的搜索,该方法的步骤包括通过下载器获取产品网页数据,依据产品知识库服务器中的数据通过分词器和索引器进行产品短语处理处理,得到含有相关性数据的产品网页并创建数据索引通过查询器输入用户查询并依据产品知识库服务器中的数据进行产品短语处理并获得相关性数据后生成查询结果,该搜索方法主要用于B2B垂直搜索的产搜索引擎系统内。 | ||
搜索关键词: | 一种 互联网 搜索引擎 搜索 方法 | ||
【主权项】:
1.一种互联网搜索引擎的搜索方法,该方法通过含由下载器,产品知识库服务器,产品网页数据服务器,分词器和索引器,索引数据库,查询器组成的搜索系统,执行产品数据的搜索,其特征在于:该方法的步骤包括对于互联网上的产品原始网页信息,通过下载器获取产品网页数据,依据产品知识库服务器中的数据通过分词器和索引器处理产品网页并创建数据索引写入索引数据库,对应产品数据网页写入产品网页数据服务器,通过查询器输入用户查询并依据产品知识库服务器中的数据处理后生成查询结果,所述依据产品知识库服务器中的数据通过分词器和索引器处理产品网页数据包括如下步骤:a.获取原始网页文本,b.根据产品知识库服务器中的产品数据对网页文本进行正向最长匹配,c.判断步骤b中匹配是否成功,d.如果匹配成功,则将匹配项进行数据短语处理得到子串并进行排序,e.对步骤d中的每个子串计算相关性,并建立索引写入索引数据库,所述依据产品知识库服务器中的数据通过查询器输入用户查询处理包括如下步骤:f.读入用户输入的查询串,g.对查询串进行正向最大匹配,生成匹配项集合,h.对匹配项集合进行产品短语处理,生成子串集合并排序,按照每个子串相关性生成有效子串序列,i.对有效子串序列中的每个子串依次获取与之匹配的网页数据集合,并根据相关性大小排序输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九城网络软件有限公司,未经北京九城网络软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710178075.9/,转载请声明来源钻瓜专利网。