[发明专利]一种基于局部用户-发帖关系图的微博帖权威性分析方法在审
申请号: | 201810503969.9 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108984585A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 涂新辉;刘子健;余升;许舸 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉天力专利事务所 42208 | 代理人: | 吴晓颖 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 局部用户 发帖 用户行为信息 检索结果 检索领域 微博信息 查询 初始化 信息能 分析 构建 算法 | ||
本发明涉及微博信息检索领域,提供一种基于局部用户‑发帖关系图的微博帖权威性分析方法,包括以下步骤:通过分析初始化微博检索结果中的用户行为信息,构建面向查询的局部用户‑微博贴关系图;利用ObjectRank算法,计算局部用户‑微博贴关系图中微博帖节点的权威性。本发明利用关系图计算微博帖权威性,这种面向查询的权威性信息能更好的反映微博帖的重要程度。
技术领域
本发明涉及微博信息检索领域,特别涉及一种基于局部用户-发帖关系图的微博帖权威性分析方法。
背景技术
近年来,随着社会化网站和应用的全面普及,社会化网络中的权威性分析逐渐成为研究的热点。和传统的新闻文本相比,微博文本由互联网上大量不同的用户创作。对于某一个特定的话题,不同用户的权威性有很大的差异。把微博帖的权威性融入到微博文本的排序过程中是提高微博信息检索效果的一种有潜力的途径。
目前的已有的结合权威性信息的微博检索方法中存在以下问题:由于用户权威性信息是基于全局分析得到的,通常只能反映这个用户在微博平台中受关注的程度,无法刻画在某个特定查询话题上各个用户和微博帖的权威性。
发明内容
本发明的目的就是为了克服上述现有技术的不足,提供一种基于局部用户-发帖关系图的微博帖权威性分析方法,通过分析初始检索结果中的微博帖及其作者信息构建局部用户-微博帖关系图,并利用关系图计算微博帖权威性,这种面向查询的权威性信息能更好的反映微博帖的重要程度。
本发明的目的是通过如下技术措施来实现的。
一种基于局部用户-发帖关系图的微博帖权威性分析方法,包括以下步骤:
(1)定义用户-微博帖模式图,模式图GS=(VS,ES)中定义了关系图的结构和边的权重,其中,VS为包含用户节点和微博帖节点的集合,RS为包含节点之间follow、followed、post、posted、repost、reposted六种关系的边的集合,follow为用户与用户的关系,post为用户和微博帖的关系,repost为微博帖之间的关系,followed,posted和reposted为上述三种关系的反向关系,每一条边eS(eS∈ES)都有对应的权重w(eS);
(2)根据定义的用户-微博帖模式图,结合初始检索结果中前N个微博帖及其发帖用户信息,建立用户-微博帖关系图G=(V,E),其中,V为包含所有用户节点和微博帖节点的集合,E为包含这些节点之间六种关系的边的集合,边e(e∈E)的权重w(e)的计算结合模式图进行,公式如下:
公式中的eS为在模式图中和e同类型的边,OutDegree(v,eS)为从节点v出发的eS类型的边的数量;
(3)利用用户-微博帖关系图计算用户和微博帖的权威性分值,计算过程如下:
(3-1)令r0=[1,...,1],α=0,r0表示初始化的权重,初始化权重全部为1,α为计步器;
(3-2)α=α+1;
(3-3)对每一个令
其中,表示第α步中r向量里面的第i个权重,w(e)表示边e=(j,i)的权重,表示第α-1步中的r向量里面的第j个权重,d为一个介于0至1之间的常量,|V|表示边的个数;
(3-4)判断|rα-rα-1|<∈是否成立,∈的取值为0.000001,如果成立执行步骤(3-5),否则跳到步骤(3-2)继续执行;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810503969.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地理信息处理方法及装置
- 下一篇:信息提供方法、服务器、终端和记录介质