[发明专利]搜索验证的系统和方法有效
申请号: | 200880016932.8 | 申请日: | 2008-04-10 |
公开(公告)号: | CN101681375A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | S·D·柯克比;P·凯利特 | 申请(专利权)人: | 埃森哲环球服务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 酆 迅 |
地址: | 瑞士沙*** | 国省代码: | 瑞士;CH |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 验证 系统 方法 | ||
技术领域
本发明涉及针对基于web的系统进行搜索验证的系统和方法。
背景技术
大部分web站点包括搜索引擎设施,从而允许该站点的访问者 在尝试定位感兴趣的项目时执行搜索。当web站点日益成为与客户 进行交流的优选手段时,web站点的所有者对确保他们的web站点 是用户友好的并且为他们的客户提供正面体验特别感兴趣。
作为对web站点进行体验的结果而遭受挫折的客户可能对拥有 站点的实体产生负面观点,并且在该web站点为客户提供进行事务 的机制的实例中(诸如定位和购买出售的项目),客户可能由于不 能快速定位并且购买所需项目而中断对项目的购买。即使对于仅向 客户提供信息的站点(诸如政府部门的web站点)来说,站点的所 有者确保客户可以定位他们需要的信息仍旧是重要的,否则负面印 象本身将表明对拥有和/或操作该web站点的实体不满意。
Web站点的一个问题在于,不能对引擎的有效性进行测试。迄 今所作的所有搜索引擎测试都是通过浏览器而手动进行的,结果, 各种组织在“事后”才意识到他们的搜索引擎的问题。
这通常是作为客户反馈的结果而发生的,在反馈中,客户曾尝 试在web站点上定位信息的项目并且将他们不能定位该信息向组织 进行报告。当然,依靠该方法来定位与web站点搜索引擎错失内容 相关联的问题导致了客户印象中的负面看法并且没有提供发现解决 方案的手段。此外,在认识到错失内容之后,该组织需要人工调查 并且解决web站点搜索引擎的问题。
当前,还没有执行搜索引擎验证以确保搜索引擎提供对web站 点(或链接的web站点集合)所含信息的全覆盖的自动化方式。而 且,也不存在可以检测搜索引擎执行的覆盖的手段。如所指示的, 当前的解决方案在以下事实之后,即,当将客户反馈递送到搜索团 队时(例如,为何我不能找到文档“a”?)。依赖于搜索引擎来传 递结果而没有深刻理解搜索引擎如何对所有web站点内容进行索 引。这是因为搜索引擎仅可以验证已经被索引的内容,而不验证错 失的内容。因而,在搜索引擎团队中工作的员工没有用于验证其搜 索引擎覆盖的主动手段。
本说明书中对任何现有技术的参考都不应作为对权利要求书的 优先权日期时公知常识的现有技术部分的承认或任何构成或建议。
发明内容
在一方面中,本发明提供了一种用于验证主机搜索引擎的结果 的方法,所述方法包括以下步骤:扫描可经由web界面递送的所有 数据对象,并且执行匹配引擎以生成包含所述主机搜索引擎错失内 容的报告集合。
所述报告集合可以包括详述所述web界面中内容的确切位置的 清单报告。其他报告可以在一个web站点报告中包括“具有最内 (most-in)链接的页面”,以辅助搜索引擎操作员来调节他们的搜 索引擎。
所述报告集合还可以包括高亮显示由web界面系统所拥有的不 同web域的web URL清单。
在本发明的实施方式中,扫描可经由web界面递送的所有数据 对象的步骤包括为了未来参考而开发所有对象的索引。在一个实施 方式中,形成web站点中所有可用词的索引。此外,可以根据词的 独特性对所有可用词的索引进行排序。例如,可以采用强度分析从 而确定扫描期间定位的词的相对独特性。
在备选实施方式中,对诸如页面、图像、文本、链接、元数据 和脚本之类的所有对象,连同文档和PDF、Word、Power Point和其 他输出格式的性质的所有对象进行捕获以及索引。
在已经建立了独特词的web站点中扫描和获取所有可用词的实 施方式中,这些可以在执行匹配引擎的时候被用作关键词。在该实 施方式中,将关键词输入到搜索引擎的相关字段中以确定关键词的 所有实例是否可以由搜索引擎定位。在将关键词输入到搜索引擎字 段中之后,继而可以将搜索引擎定位的所得URL集合与扫描所标识 的URL集合进行比较。针对关键词的、扫描所标识的URL集合与 搜索引擎尝试定位相同关键词的所有实例之间的任何差异表示错失 的内容。
在本发明的实施方式中,所述报告集合包括存在错失内容的 URL。
在另一方面,本发明提供一种用于验证主机搜索引擎的结果的 系统,所述系统包括:
主机搜索引擎,用于执行对web站点的搜索;
扫描组件,其扫描并且定位可经由到所述web站点的web界面 可获得的所有数据对象;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于埃森哲环球服务有限公司,未经埃森哲环球服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880016932.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于无线系统的多载波技术
- 下一篇:接口处理器