[发明专利]基于用户转发行为的微博阅读概率计算方法有效
申请号: | 201410020499.2 | 申请日: | 2014-01-16 |
公开(公告)号: | CN103761292B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 宋丹丹;杜建光;廖乐健;礼欣 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 转发 行为 阅读 概率 计算方法 | ||
技术领域
本发明涉及一种基于用户转发行为的微博阅读概率计算方法,属于计算机应用技术领域。
背景技术
随着在线社交网络的高速发展,微博这种新型的社交网络在人们的生活中发挥着越来越重要的作用。因此,在微博中进行用户行为分析逐渐成为一个新兴的热点研究方向。
在已有研究中,关于用户行为的分析侧重于在微博中进行统计分析,例如:认证用户的个数、活跃用户的个数、用户的地理位置分布、用户每天发的微博个数与时间的关系、用户回复和转发情况等。在这些统计数据上进一步进行数据挖掘对微博中的应用,如:推荐系统、虚拟广告等都具有重要意义。
阅读行为和转发行为都属于用户行为。用户阅读其好友所发的微博,同时转发有意义的微博。现实中,用户往往关注许多好友,这些好友每天会发表大量的微博。因此,对一个用户而言,其能够阅读的微博数量巨大,而用户每天有特定的活动规律,因此这些微博中,有些微博有较大的可能性被阅读,而有些微博被阅读的可能性会很低。
近些年来,虽然研究人员做了大量关于社交网络的研究。但还没有研究人员根据用户的行为,研究其好友所发微博被阅读的概率。早期,研究人员根据用户的被关注程度计算用户的影响力,随后研究人员通过分析用户行为(转发、回复、提到)来计算用户的影响力,结果表明分别通过用户转发行为、用户回复发行为和用户提到(@)行为计算得到的用户影响力结果之间能够很好的相互关联,而这三个结果与通过被关注数计算得到的用户影响力不相关联,这表明通过被关注数计算得到的用户影响力的准确度更低。但分别通过用户转发行为、用户回复发行为和用户提到行为计算得到的用户影响力的方法存在一个明显的缺陷:这些研究没有更深层次的考虑用户的阅读行为。例如:用户每天查看微博的上线习惯。
用户阅读微博有一定的习惯,例如:当用户在浏览微博时,这些微博是按照时间倒序排列的。通常情况下,用户会从上到下阅读微博。当阅读完一页的时候,通过点击“更多”按钮阅读更早的微博。一旦遇到感兴趣的微博,用户会选择转发。根据这些习惯,2010年CIKM会议上,Zi Yang等人将用户好友所发的微博分为三类:转发、错过、忽略,并将这些习惯作为一个特征,系统的研究了转发行为的内在机制。
总体而言,已有的研究存在以下问题:
(1)在计算用户影响力时没有考虑用户的行为习惯。导致这种计算方法不能很好的刻画用户的阅读行为。例如在极端情况下,用户好友会发表大量的微博,对用户而言阅读到所有的微博是不可能的。
(2)虽然一些研究考虑了用户的阅读行为习惯,但是没有更深进一步的研究这些阅读习惯。
发明内容
本发明的目的是在于针对现有技术的缺点,提供一种基于用户转发行为的微博阅读概率计算方法。
一种基于用户转发行为的微博阅读概率计算方法,用于计算在一段给定的时间范围内(用符号(T1,T2)表示,其中T1、T2之间的时间间隔不小于1小时),一用户(用符号H表示)的好友发送的一条微博(用符号Wx表示,其发送时间用tx表示,T1<tx<T2)被用户H阅读的概率(用符号P(Wx)表示),其具体操作步骤如下:
步骤一、在给定的时间范围(T1,T2)内,查找时间tx之前用户H转发的最后一条微博(用符号Wi表示)的原始发送时间点(用符号ti表示,T1<ti<tx),以及时间tx之后用户H转发的第一条微博(用符号Wj表示)的原始转发时间点(用符号tj表示,tx<tj<T2);同时获取微博Wi的转发时间点(用符号ti′表示,T1<ti′<T2)和微博Wj的转发时间点(用符号t′j表示,T1<tj′<T2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410020499.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:苹果的施肥方法
- 下一篇:三维霍普金森压杆转向头装置