[发明专利]一种用于确定超链接的锚文本可信度的分析设备和方法无效

专利信息
申请号: 201010620055.4 申请日: 2010-12-31
公开(公告)号: CN102567417A 公开(公告)日: 2012-07-11
发明(设计)人: 杨宣;姚旭 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人: 罗朋
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 确定 超链接 文本 可信度 分析 设备 方法
【说明书】:

技术领域

发明涉及互联网技术领域,尤其涉及用于确定超链接的锚文本可信度的链接分析技术。

背景技术

在当今的互联网中,网页数量日趋庞大,为了建立网页与网页、网页与网站之间的链接关系,经常使用基于超链接和/或锚文本的链接技术。一般来说,超链接是一种对象,它以特殊编码的文本或图形的形式来实现链接,当点击该链接时,相当于指令浏览器移至同一网页内的某个位置、或打开一个新的网页、或打开一个新的WWW网站中的网页。例如,网页中的超链接大致分为绝对URL的超链接、相对URL的超链接和书签超链接。

另外,超链接中的锚文本通常是对一个网页内容的高度概括描述,与该网页有着高度的内容相关性。将超链接的锚文本应用于搜索引擎,还可以基于所述锚文本进行内容相关度计算,以获取用户查询序列与网页的相关度,从而对搜索结果中的网页进行精确排名。

由上述可知,在正常情形下,锚文本均可以对超链接指向的页面内容进行高度概括,并相当程度上反映出该页面的内容。但是,互联网上存在大量的超链作弊行为,锚文本与超链接指向页面之间不再总是内容高度相关,当搜索引擎基于锚文本来获取搜索结果时,甚至还有可能出现与查询序列内容不相关而排名却很高的网页。

有鉴于此,如何确定超链接的锚文本可信度,以评估和分析超链接的锚文本与超链接指向页面之间内容相关性,是相关领域的技术人员亟待解决的一项课题。

发明内容

本发明的目的是提供一种用于确定超链接的锚文本可信度的分析设备和方法。

根据本发明的一个方面,提供一种计算机实现的用于确定超链接的锚文本可信度的方法,其中,该方法包括以下步骤:

a获取与所述超链接相对应的锚文本;

b根据所述锚文本,获取与所述锚文本对应的锚文本相关信息;

c根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。

根据本发明的另一个方面,还提供了一种用于确定超链接的锚文本可信度的分析设备,其中,该分析设备包括:

第一获取装置,用于获取与所述超链接相对应的锚文本;

第二获取装置,用于根据所述锚文本,获取与所述锚文本对应的锚文本相关信息;

锚文本可信度确定装置,用于根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。

根据本发明的再一个方面,还提供了一种搜索引擎,其中,该搜索引擎包括本发明的一个方面所述的用于确定超链接的锚文本可信度的分析设备。

与现有技术相比,本发明基于锚文本相关信息来加权确定超链接的锚文本可信度,使超链接的锚文本与超链接指向页面之间的内容相关性更加合理。此外,将本发明应用到搜索引擎领域,还可精确地检测作弊超链的虚假锚文本、过期超链的失效锚文本,调整基于所述锚文本可信度对包含所述虚假锚文本和失效锚文本的超链接指向页面的权威度和排名,进而提升搜索引擎搜索结果的排序质量。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1示出依据本发明一个方面的用于确定超链接的锚文本可信度的分析设备的结构示意图;

图2示出依据本发明一优选实施例的用于确定超链接的锚文本可信度的分析设备的结构示意图;

图3示出依据本发明另一方面的用于确定超链接的锚文本可信度的流程图;

图4示出依据本发明一优选实施例的用于确定超链接的锚文本可信度的流程图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1示出依据本发明一个方面的用于确定超链接的锚文本可信度的分析设备的结构示意图。其中,所述分析设备1包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。参照图1,所述分析设备1包括第一获取装置11、第二获取装置12和锚文本可信度确定装置13。具体地,分析设备1的第一获取装置11获取与所述超链接相对应的锚文本;接着,第二获取装置12根据所述锚文本,获取与所述锚文本相对应的锚文本相关信息;最后,锚文本可信度确定装置13根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010620055.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top