[发明专利]一种用于确定超链接的锚文本可信度的分析设备和方法无效
申请号: | 201010620055.4 | 申请日: | 2010-12-31 |
公开(公告)号: | CN102567417A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 杨宣;姚旭 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 确定 超链接 文本 可信度 分析 设备 方法 | ||
1.一种计算机实现的用于确定超链接的锚文本可信度的方法,其中,该方法包括以下步骤:
a获取与所述超链接相对应的锚文本;
b根据所述锚文本,获取与所述锚文本对应的锚文本相关信息;
c根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。
2.根据权利要求1所述的方法,其中,所述锚文本相关信息包括以下至少任一项:
-所述锚文本在所述超链接指向页面的所有入链的锚文本的统计分析结果中所占比例;
-所述锚文本在所述超链接所在页面的所有出链的锚文本的统计分析结果中所占比例;
-所述锚文本与所述超链接指向页面的关联度。
3.根据权利要求1或2所述的方法,其中,该方法还包括:
-根据所述超链接指向页面,并结合页面黑名单,调整所述超链接的锚文本可信度。
4.根据权利要求3所述的方法,其中,所述方法还包括:
-获取作弊页面或不良页面;
-根据所述作弊页面或不良页面,建立或更新所述页面黑名单。
5.根据权利要求1至4中任一项所述的方法,其中,所述方法还包括步骤:
-获取与所述超链接相对应的超链接相关信息;
其中,所述步骤c还包括:
-根据所述锚文本相关信息,结合所述超链接相关信息,确定所述超链接的锚文本可信度。
6.根据权利要求5所述的方法,其中,所述超链接相关信息包括以下至少任一项:
-所述超链接的产生时间;
-所述超链接的位置;
-所述超链接在所述超链接指向页面的所有入链的统计分析结果中所占比例;
-所述超链接在所述超链接所在页面的所有出链的统计分析结果中所占比例。
7.根据权利要求1至4中任一项所述的方法,其中,所述方法还包括步骤:
-获取所述超链接指向页面更新前与更新后的相关度;
其中,所述步骤c还包括:
-根据所述锚文本相关信息,结合所述相关度,确定所述超链接的锚文本可信度。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:
-根据用户通过用户设备输入的查询序列,获取与所述查询序列相对应的超链接;
其中,所述步骤a还包括:
-根据所述超链接,获取与所述超链接相对应的锚文本;
其中,所述方法还包括步骤:
-根据所述超链接的锚文本与所述查询序列的内容相关度,并结合所述锚文本可信度,对与所述超链接对应的搜索结果进行排序。
9.根据权利要求1至8中任一项所述的方法,其中,所述方法还包括:
-根据所述锚文本可信度,将所述超链接所在页面的权威值分配给所述超链接所在页面的出链。
10.根据权利要求1至9中任一项所述的方法,其中,所述方法还包括:
-根据下述关系式,调整所述超链接的锚文本可信度Ci:
Ci=λ×Ci-1+(1-λ)×Cu
其中,Cu为第i时刻未经调整的锚文本可信度,Ci-1为第i-1时刻所述超链接的锚文本可信度,λ为0至1之间的修正因子。
11.一种用于确定超链接的锚文本可信度的分析设备,其中,该分析设备包括:
第一获取装置,用于获取与所述超链接相对应的锚文本;
第二获取装置,用于根据所述锚文本,获取与所述锚文本对应的锚文本相关信息;
锚文本可信度确定装置,用于根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。
12.根据权利要求11所述的分析设备,其中,所述锚文本相关信息包括以下至少任一项:
-所述锚文本在所述超链接指向页面的所有入链的锚文本的统计分析结果中所占比例;
-所述锚文本在所述超链接所在页面的所有出链的锚文本的统计分析结果中所占比例;
-所述锚文本与所述超链接指向页面的关联度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010620055.4/1.html,转载请声明来源钻瓜专利网。