[发明专利]基于关注关系的Blog搜索结果排序算法无效
申请号: | 201210193897.5 | 申请日: | 2012-06-13 |
公开(公告)号: | CN103257982A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 赵朋朋;鲜学丰;陈明;吴健;崔志明 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 曹毅 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关注 关系 blog 搜索 结果 排序 算法 | ||
1.基于关注关系的Blog搜索结果排序算法,其特征在于,包括以下步骤:
步骤1)博主关注因素的分析:分析博主在Blog空间内的影响力,即分析该博主与其他博主之间的关注因素;
步骤2)博主关注关系网络的建立:将步骤1中所分析的博主之间有可能存在的相互关注的关系转换成博主之间链接的边,则可以得到一个基于关注关系的博主关系网络;
步骤3)博主影响力的确定:将每个博主对其他不同博主所给出的不同关注度进行量化,并基于步骤1的分析和步骤2的关注关系网络的相关理论给出博主影响力衡量算法,并对博主影响力进行确定;
步骤4)博文内容价值的衡量:
1)博文内容价值的衡量:
通过博文所获得的关注情况来判断该博文的内容价值,通过该博文的被评论和被引用的情况来判断该博文的关注情况;
2)新博文内容价值的衡量:
根据该博主以往在某个指定类别上的博文质量来决定新博文的得分值;
步骤5)静态得分:将博文自身的价值、表该博文的博主影响力、评论者对该博文的情感态度以及博文所包含评论的吸引力这些因素通过量化后静态地存储在数据库中;
步骤6)博文的搜索排序算法:
综合博文的静态得分、博文与查询的相似度以及博文的新鲜度来描述博文的搜索排序算法;
1) 博文新鲜度:
通过基于时间的衰减因子来将过时Blog文章的排序得分进行衰减,首先将整个考量的时间段切分成n个不同的时间块,将不同时间发布的博文放入不同的时间块内,计算衰减系数;
2)查询相似度:
相似度方面采用查询文档向量和博文文档向量余弦相似度计算;
3)算法整合:
在综合分析了博文静态得分、博文新鲜度以及博文与查询相似度三方面的因素后,给出整合后的搜索排序算法;其中博文的静态得分可以在前期处理时通过离线计算存入索引中,博文新鲜度可根据检索的当前时间和博文的发表时间来计算,查询相似度则根据所进行检索的查询词动态获取。
2.根据权利要求1所述的基于关注关系的Blog搜索结果排序算法,其特征在于:步骤1中所述博主的关注因素主要体现在四个方面,其包括:
1) 加该博主为博友 ;
2) 评论该博主的博文;
3) 引用该博主的博文;
4) 阅读该博主的博文。
3.根据权利要求1所述的基于关注关系的Blog搜索结果排序算法,其特征在于,步骤2中所述的一个基于关注关系的博主关系网络,其建立步骤如下:
1)对于评论关系,如果博主A对博主B的博文进行了一条或多条的评论,则建立由A向B的有向边;
2)对于引用关系,如果博主A所发表的博文对B中的博文进行了一次或多次的引用,则建立由A向B的有向边;
3)在博友关系上,将这种关系扩展成A和B间的双向边;
由此就建立起了一个在Blog空间内基于博主之间关注关系的社区关系网络。
4.根据权利要求1所述的基于关注关系的Blog搜索结果排序算法,其特征在于,步骤3中所述博主影响力衡量算法,包括以下步骤:
假定Blog空间中存在博主i和博主j;
1)用特定的计算式,计算博主i在评论、引用通告以及博友三种关注关系上的分配权重比值;
2)在将博主i所给出的关注度总量在其不同的关注行为上进行划分后,衡量博主i对某一个特定博主j的关注度;所述对博主j的关注度包括评论关注、引用关注和博友关注三方面; 计算博主i对博主j在上述三方面的关注占各自总量的比例并将其量化;
3)结合社区关系理论,计算博主的影响力。
5.根据权利要求1所述的基于关注关系的Blog搜索结果排序算法,其特征在于,步骤5中所述静态得分,其具体分析如下:
1) 发表该博文的博主所拥有的影响力:如果读者事先知道了哪些博主更具有影响力,权威度更高,那么读者肯定倾向于阅读这一类博主发表的博文;
2) 博文本身内容的价值:也就是如果作为单一的博文来考虑,其对读者所拥有的吸引力或者价值;
3) 评论中的情感信息所体现出的对博文的评价:如果一篇博文的评论都表达是正面评价那么该博文显然质量比较高,如果都是负面评价则相反;
4) 评论本身作为Blog的一部分,对读者有着很强的吸引力,甚至有些时候评论的吸引力要超过博文内容本身的吸引力,而先前的研究工作却几乎都忽视了这一因素对排序的影响;
经过上述分析,得出一篇博文的静态得分公式,并进行计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210193897.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于热喷涂的镍基钨稀土合金粉末及其制备方法
- 下一篇:调用方法及调用系统