[发明专利]代理搜索引擎方法无效
申请号: | 201010550798.9 | 申请日: | 2010-11-19 |
公开(公告)号: | CN102043831A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 李梦怡 | 申请(专利权)人: | 四川圣望科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代理 搜索引擎 方法 | ||
一.技术领域
本发明公开一种新的互联网搜索引擎方法,特别是基于代理模式的搜索引擎方法。
二.背景技术
时下常见的互联网信息搜索方法有两种:①通过百度、谷歌这类综合搜索门户网站;②通过垂直搜索门户网站。这两种搜索引擎从技术而言是有很大差异的。百度、谷歌这类综合搜索门户采用水平搜索技术,而垂直搜索门户采用的是垂直搜索技术。
百度、谷歌等综合搜索引擎由于采用的是水平搜索技术,存在以下明显的不足:①网页更新慢:由于水平搜索技术需要将各种网页本地化,面对海量的网页,综合搜索引擎的网页本地化更新周期需要十几天到数十天之久,不能充分满足对实时性要求很高的商业类资讯搜索的要求;②搜索精度低:这是百度、谷歌等综合搜索引擎的致命短板,其结果是用户在使用综合搜索引擎时面对数以百万计而仅有少部分符合要求的答案茫然不知所措。
垂直搜索技术正是因为综合搜索引擎的不足而发展起来的。垂直搜索技术由于没有海量网页本地化要求,因此也不存在网页本地化更新周期的问题,理论上讲垂直搜索技术可以做到以秒为单位的信息更新。同时,垂直搜索技术深入网页精准抓取网页数据,搜索精度非常高,反馈给用户的结果皆是有用的答案,避免了用户在海量答案中进一步寻找的苦差。
由于网页中的信息与应用领域密切相关,垂直搜索技术在应用上便自然分化为与应用领域或行业密切相关的细分产品,例如:音乐搜索、图片搜索、博客搜索等。垂直搜索引擎这种行业细化分类有效解决了搜索精度问题。研究表明,每增加一个细化分类,就能使搜索精度得到成倍的提高。然而,市场分得越细,搜索引擎细分产品的数量也会越多。面对众多的垂直搜索引擎,用户搜索前并不清楚他的问题需要选择哪个搜索引擎去实现。指望用户记住这数百乃至上千个技术方法、技术水平、操作风格、服务特点各不相同的垂直搜索引擎是不现实的?对用户来说,要找到他所需要的垂直搜索引擎或许会比他在精度不足的综合搜索引擎上寻找结果更加麻烦。这就是垂直搜索虽然比水平搜索既快又精准,但人们仍然喜欢使用百度、谷歌这种精准度不高信息获得需要一系列网页浏览操作的综合搜索引擎完成搜索的内在原因。
三.发明内容
本发明的目的在于提供一种新的代理搜索引擎方法,该方法的核心是在用户和众多专业的垂直搜索引擎群之间建立代理机制。该方法的既保持搜索的高精度和实时性,又避免垂直搜索细分产品数量繁多选用困难的问题。
本发明代理搜索引擎方法包括以下步骤:
A、搜索问题描述字串输入。接收用户搜索问题描述字串的输入。
B、搜索问题描述字串分析。首先将搜索问题描述字串通过分词技术从词库中的标准词与搜索问题描述字串各分离词汇的匹配关系确定搜索问题描述字串的关键词集合,再从领域分类索引库找出这些关键词各自的领域特征,最后按照特定的规则和推理算法推断出搜索问题描述字串所对应的领域。
C、代理资源优选。根据前述搜索问题描述字串分析后所推断出的领域归属情况,从代理搜索资源库中过滤出符合领域特征的搜索引擎集合,并按照优选原则筛选出承担本次搜索任务的搜索引擎。
D、搜索分发和驱动。通过调用事先建好的代理搜索资源调用驱动方法库中相应的方法对优选的搜索引擎逐个实施搜索驱动,由这些搜索引擎各自独立完成实际的搜索动作。
E、搜索结果处理。从所驱动的各搜索引擎输出页面中抓取搜索答案并按输出需要进行必要的去重、格式化加工等处理,最后将搜索答案反馈给用户。
本发明的使用效果是:
本发明在用户搜索和数量繁多的专业的垂直搜索引擎群之间建立起新的代理搜索机制,该代理搜索机制有效避免了垂直搜索细分产品数量繁多选用困难的问题,并且保持了垂直搜索技术所贡献的搜索高精度和实时性。同时,代理搜索引擎和众多垂直搜索引擎之间相对独立,不受众多垂直搜索引擎各自的技术水平差异、技术深入演变情况、和数量急剧膨胀等条件的制约。对解决垂直搜索技术不能构建起像百度、谷歌那样统一的搜索平台的难题,改善目前垂直搜索引擎的应用现状,促进垂直搜索技术的进一步发展,为用户提供更加优越的搜索环境等方面都具有明显的积极意义。
四.附图说明
图1为本发明代理搜索引擎方法逻辑流程图。
五.具体实施方式
实施例1
本实施例说明本发明代理搜索引擎方法中搜索问题描述字串分析所使用的领域分类索引库的技术特征。在本实施例中,领域分类索引库是基于语义分类方法实现词库中所有标准词的领域归属特征的刻画和索引。
实施例2
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川圣望科技有限公司,未经四川圣望科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010550798.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:挤出线的冷却分环
- 下一篇:珍珠米粉及其制作方法