[发明专利]一种网络社区活跃用户簇的发现方法、终端设备及存储介质在审
申请号: | 201711096102.8 | 申请日: | 2017-11-09 |
公开(公告)号: | CN107749033A | 公开(公告)日: | 2018-03-02 |
发明(设计)人: | 徐晓文;李火泉;栾江霞;章正道 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06K9/62 |
代理公司: | 厦门市精诚新创知识产权代理有限公司35218 | 代理人: | 何家富 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 社区 活跃 用户 发现 方法 终端设备 存储 介质 | ||
1.一种网络社区活跃用户簇的发现方法,其特征在于:包括以下步骤:
S10:通过网络社区软件收集该网络社区内的用户群体;
S20:获取代表用户活跃度的用户特征数据,包括交互数据和关系数据;所述交互数据为用户通过网络社区软件进行信息交流的数据,关系数据为用户在网络社区内部与其他用户建立联系的数据;
S30:去除低活跃度用户,即交互数据和关系数据均低的用户;
S40:根据特征数据对用户活跃度的影响大小不同确定用户特征数据的权重系数,影响大的特征数据所占的权重系数大,影响小的特征数据所占的权重系数小,用户的所有特征数据所对应的权重系数总和为1;
S50:根据各特征数据及其所占权重的值,得到每个用户的特征数据模型;
S60:通过聚类算法根据用户的相似度将用户分为不同的用户簇;
S70:通过计算各用户簇的聚类中心用户与完全不活跃用户的距离确定活跃用户簇。
2.根据权利要求1所述的网络社区活跃用户簇的发现方法,其特征在于:所述步骤S10内的用户群体收集方式包括:
S101:通过设定关键字,使用网络社区官方软件的编程接口进行搜索得到初始用户群;
S102:通过收集初始用户群在上述网络社区官方软件内的社交关系用户得到最终用户群。
3.根据权利要求1所述的网络社区活跃用户簇的发现方法,其特征在于:所述步骤S20内的交互数据包括发帖总量、最近一月发帖量、原创帖量,关系数据包括关注数和粉丝数,即用户的特征数据包括发帖总量、最近一月发帖量、原创帖量、关注数和粉丝数,其中发帖总量、最近一月发帖量、原创帖量、关注数和粉丝数分别用mbi、mri、moi、foi和fai来表示,其中i为用户编号,值为1、2、3……、n中的某一个,当i为不同值时分别对应不同的用户。
4.根据权利要求3所述的网络社区活跃用户簇的发现方法,其特征在于:所述步骤S40内权重系数的设定中,发帖总量、最近一月发帖量、原创帖量、关注数和粉丝数所占的权重系数分别为:n_mb=0.1、n_mr=0.3、n_mo=0.3、n_fo=0.1、n_fa=0.2,其中n_mb表示发帖总量的权重系数、n_mr表示最近一月发帖量的权重系数、n_mo表示原创帖量的权重系数、n_fo表示关注数的权重系数、n_fa表示粉丝数的权重系数。
5.根据权利要求4所述的网络社区活跃用户簇的发现方法,其特征在于:所述步骤S50内的用户特征数据模型为:
Fi=(nmbi,nmri,nmoi,nfoi,nfai),
其中nmbi=n_mb×mbi、nmri=n_mr×mri、nmoi=n_mo×moi、nfoi=n_fo×foi、nfai=n_fa×fai,
其中i为用户编号,值为1、2、3、……、n中的某一个,当i为不同值时分别对应不同的用户。
6.根据权利要求1所述的网络社区活跃用户簇的发现方法,其特征在于:所述步骤S60内的聚类算法为k-means算法,具体步骤包括:
S601:从用户群体中任意选取k个用户作为初始聚类中心;
S602:将用户按照距离最小原则分配到临近聚类;
S603:重新计算每个新聚类所有用户的均值,即为该聚类的新聚类中心;
S604:不断重复步骤S602、S603,直到聚类中心不再变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711096102.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备
- 下一篇:一种2.5维闭合环型频率选择表面结构