[发明专利]一种互联网搜索引擎的搜索方法无效
申请号: | 200710178075.9 | 申请日: | 2007-11-26 |
公开(公告)号: | CN101271464A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 王双;吴爱华;苗宇枫;谌谦;李建锋;徐光美;吴柏林 | 申请(专利权)人: | 北京九城网络软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京双收知识产权代理有限公司 | 代理人: | 解政文 |
地址: | 100070北京市丰*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 搜索引擎 搜索 方法 | ||
技术领域
本发明涉及计算机网络技术,特别是涉及一种互联网搜索引擎的搜索方法。
背景技术
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。一个出色的搜索引擎能够及时向用户提供所需要的信息,而要做到这点就需要一个快速、优质、高效的搜索方法予以支持。Google搜索引擎依靠其Page Rank机制及收敛算法一直处于该领域的领先地位。Google公司的搜索引擎最初是斯坦福大学的博士研究生SergeyBrin和Lawrence Page实现的一个原型系统,现在已经发展成为互联网上最好的搜索引擎之一。Google的体系结构类似于传统的搜索引擎,它与传统的搜索引擎最大的不同处在于对网页进行了基于权威值的排序处理,使最重要的网页出现在结果的最前面。Google通过PageRank元算法计算出网页的Page Rank值,从而决定网页在结果集中的出现位置,Page Rank值越高的网页,在结果中出现的位置越靠前。
相对于Google、Baidu等通用的搜索引擎,专业B2B(Business to Business)垂直搜索所提供的B2B信息更加精准、更专业且更具深度;而相对于传统的B2B门户网站,专业B2B垂直搜索能够提供更全面、更客观、更多元化的信息内容。有鉴于此,专业B2B垂直搜索作为互联网快速发展、细分的产物,正日益受到企业用户的青睐,而这也奠定了电子商务B2B技术模式富于生命力的根基所在。
与传统搜索引擎类似,基于B2B电子商务的垂直搜索引擎需要返回的结果页面是用户所关心的信息。而对于电子商务应用搜索来讲传统搜索引擎的排名技术显然已经不适用于B2B专业垂直搜索的需求,搜索页面的结果排名不应去考虑链接到该页面的超链接数量而更多是那些与企业商务紧密联系的专业信息。正是有上述的应用需求,基于产品质量算法的垂直搜索引擎方法被提出用来综合评价搜索结果的质量,并在结果页面进行排名,以提高用户搜索质量并帮助海外采购商快速、精准地筛选优质供应商。
基于互联网的产品搜索服务需要将散布于互联网上各个独立网站上的产品与相关数据搜集起来,提供统一的检索服务,因此产品数据的检索功能对整体业务而言是非常重要的,检索方法既要满足产品数据的检索这样一个特定要求,又要具有很高的性能。
基于互联网的产品搜索服务是一种垂直搜索服务,对垂直搜索的领域有很强的限定性,需要针对领域相关的数据尽可能全面搜集,并提供集中深度的检索,而一般的互联网通用搜索方法不具有这样的特点,因此两者对搜索方法的要求是不一样的。概括而言,垂直搜索领域的搜索方法要对所针对领域的数据具有格外的关注能力。具体到互联网产品搜索业务来讲,这样的要求体现在两个方面:第一个方面是在检索中要对产品数据区别对待,以体现领域限定性;第二个方面是要能处理关于产品的复杂的查询,以满足全面精确搜索的要求。另外,互联网搜索业务需要面对的数据是海量的,并且需要应付大量并发的搜索,因此对整体搜索系统性能具有很高的要求。
垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。可以简单的说成是搜索引擎领域的行业化分工。众多专业性网站、行业网站独立服务于互联网的成功,恰恰证明了互联网的格局应该是多方面的。通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息需求服务。市场需求多元化决定了搜索引擎的服务模式必将出现细分,针对不同行业提供更加精确的行业服务模式。
发明内容
本发明的目的在于提供一种适应互联网垂直产品搜索的特点,实现高性能,高精度的搜索引擎的搜索方法。
为达到上述目的,本发明提供的互联网上基于知识库的搜索方法通过含由下载器,产品知识库服务器,产品网页数据服务器,分词器和索引器,索引数据库,查询器组成的搜索系统,执行产品数据的搜索,该方法的步骤包括对于互联网上的产品原始网页信息,通过下载器获取产品网页数据,依据产品知识库服务器中的数据通过分词器和索引器处理产品网页并创建数据索引写入索引数据库,对应产品数据网页写入产品网页数据服务器,通过查询器输入用户查询并依据产品知识库服务器中的数据处理后生成查询结果,所述依据产品知识库服务器中的数据通过分词器和索引器处理产品网页数据包括如下步骤:
a.获取原始网页文本,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九城网络软件有限公司,未经北京九城网络软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710178075.9/2.html,转载请声明来源钻瓜专利网。