[发明专利]一种热点事件分类方法及装置有效
申请号: | 201510645347.6 | 申请日: | 2015-10-08 |
公开(公告)号: | CN105335476B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 牛凯;黄家坤 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 热点 事件 分类 方法 装置 | ||
1.一种热点事件分类方法,其特征在于,所述方法包括步骤:
接收待分类的热点事件;
确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离;
将所述待分类的热点事件划分到该距离的最小值对应的聚类中,其中根据以下方法,确定每个聚类的中心点对应的热点事件:采集每个热点事件,并获取该热点事件对应的设定时间长度内的转发数量或评论数量;针对每个热点事件,判断该热点事件的平均时间转发量和意见领袖占有率D是否都大于相应的平均时间转发量阈值tR和意见领袖占有率阈值tD;如果否,则删除该热点事件,如果是,则根据该热点事件对应的设定时间长度内的转发数量或评论数量,对热点事件进行聚类,将该热点事件划分到不同的聚类中;在每个聚类中,针对该聚类中包含的每个热点事件,确定该聚类的中心点对应的热点事件;
其中根据如下公式确定平均时间转发量和意见领袖占有率D:
为平均时间转发量,D为意见领袖占有率,Rt为该热点事件的总转发量,T为设定的时间长度,Vb为该热点事件传播过程中转发该热点事件的意见领袖的个数,Vt为该热点事件传播过程中转发该热点事件的用户的个数。
2.根据权利要求1所述的方法,其特征在于,所述确定该聚类的中心点对应的热点事件之后,所述方法还包括:
针对每个聚类的中心点对应的热点事件,根据如下公式对该中心点对应的热点事件在设定时间长度内的转发数量或评论数量进行调整:
其中,ΔB(t)为设定时间长度内调整后的时间点t的转发量,U(n)为该热点事件在设定时间长度内的当前时间点n时,在网络中未传播到的用户的个数,ε为采集到的热点事件中包含的噪声所对应的广告事件和个人事件的数量,S(t)根据以下公式确定:
其中,nb为该热点事件在设定时间长度内传播到预设的意见领袖的时间点;
G(t)根据以下公式确定:
其中,a为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值时的幅值,w为该热点事件在设定时间长度内从转发量或者评论数量出现第一峰值到第二峰值的时间长度,tp为该热点事件在设定时间长度内的转发量或者评论数量出现第二峰值的时间点;
f(τ)根据以下公式确定:
f(τ)=β*τ-1.5
其中β为热点事件传播过程中的传播系数,τ为传播过程中的每个时间点。
3.根据权利要求1所述的方法,其特征在于,所述确定该聚类的中心点对应的热点事件包括:
根据属于类别Ck的所有热点事件xi,与中心点对应的热点事件μk的距离d(xi,μk)的和为最小,确定该聚类的中心点对应的热点事件其中xi为属于类别Ck的所有热点事件,μk为中心点对应的热点事件,为确定的该聚类的中心点对应的热点事件。
4.根据权利要求1所述的方法,其特征在于,确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离包括:
根据以下公式确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离:
其中,x(t)为该待分类的热点事件x在该设定时间长度内每个时间点t的转发数量或评论数量,C(t)为聚类中心对应的热点事件C在该设定时间长度内每个时间点t的转发数量或评论数量,T为设定的时间长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510645347.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库的操作方法及装置
- 下一篇:内容获取方法及装置