[发明专利]点击距离确定有效
申请号: | 200680035828.4 | 申请日: | 2006-09-25 |
公开(公告)号: | CN101273350A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | M·佩特里克 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 张政权 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击 距离 确定 | ||
1.一种用于确定与网络上的文档相关联的点击距离的计算机实现方法,包括:
存储文档(210)的文档和链接信息(218);
在所述文档和链接信息(218)内,还存储与目标文档(574)相关联的专门字词(580),其中所述专门字词(580)指定对应于所述目标文档(574)的源文档(572);
在倒排索引(510)中包括所述专门字词(580),其中所述本地存储的倒排索引(510)使所述专门字词与所述目标文档(574)的标识符相关;以及
当根据传入所述专门字词(580)的查询对所述目标文档(574)查询倒排索引时,对所述源文档(572)赋予一点击距离。
2.如权利要求1所述的计算机实现方法,其特征在于,所述倒排索引对应于一锚文本索引(612),所述锚文本索引被安排成存储所述锚文本(576)中包含的字词和被标识为与每一字词相关联的文档(210)的清单。
3.如权利要求1所述的计算机实现方法,其特征在于,存储所述文档和链接信息(218)还包括存储所述源文档(572)中包括的锚文本(576),其中存储所述锚文本(576)使得所述锚文本(576)与所述目标文档(574)相关联。
4.如权利要求3所述的计算机实现方法,其特征在于,还包括在锚文本表(570)中存储包括所述锚文本(576)的所述文档和链接信息(218)。
5.如权利要求4所述的计算机实现方法,其特征在于,当所述目标节点之一的点击距离大于当前节点的点击距离加上一变量时(718),所述目标节点之一的点击距离被设置为所述当前节点的点击距离加上所述变量(720)。
6.如权利要求1所述的计算机实现方法,其特征在于,存储所述专门字词(580)还包括将所述专门字词追加到存储在锚文本表(570)内的锚文本(576)。
7.如权利要求6所述的计算机实现方法,其特征在于,还包括构造锚图(300),它包括所述网络的文档作为所述锚图(300)的节点(310),还包括所述锚文本表(570)的记录作为所述锚图(300)的链接(320)。
8.如权利要求1所述的计算机实现方法,其特征在于,在所述倒排索引(510)中包括所述专门字词(580)还包括当追加所述专门字词(580)的锚文本(576)被插入所述倒排索引(510)时也将所述专门字词(580)插入所述倒排索引(510)内。
9.如权利要求1所述的计算机实现方法,其特征在于,对所述源文档(572)赋予一点击距离还包括当所述源文档对应于锚图(300)内的高权威节点(330)时将所述源文档(572)赋予一初始点击距离值。
10.如权利要求9所述的计算机实现方法,其特征在于,为所述锚图(300)指定多于一个的高权威节点(330)。
11.如权利要求9所述的计算机实现方法,其特征在于,还包括当所述源文档(272)对应于不同于高权威节点(330)的一节点(310)时赋一初始无穷大值作为所述点击距离值(706)。
12.如权利要求11所述的计算机实现方法,其特征在于,还包括当所述源文档具有不同于所述初始无穷大值的点击距离值时将所述源文档插入队列中(708)。
13.如权利要求11所述的计算机实现方法,其特征在于,还包括从所述队列中检索所述源文档以查询所述倒排索引(714)。
14.一种其上存储当执行时实现如权利要求1所述的计算机实现方法的指令的计算机可读介质。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680035828.4/1.html,转载请声明来源钻瓜专利网。