[发明专利]微博用户的潜在特征的挖掘方法及装置在审
申请号: | 201710580692.5 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107403389A | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 晋彤 | 申请(专利权)人: | 广州特道信息科技有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 梁顺宜,郝传鑫 |
地址: | 510000 广东省广州市越秀*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 潜在 特征 挖掘 方法 装置 | ||
技术领域
本发明涉及计算机网络领域,尤其涉及一种微博用户的潜在特征的挖掘方法及装置。
背景技术
近年来,社交网络迅速发展,用户人数呈爆炸式增长。通过社交网络服务,人们除了进行社交行为,则更多的是将社交网络当成公共的媒体平台,满足社交需求和特定兴趣获取需求。对于用户的专业信息及特定兴趣获取需求,而当前社交网络产品则不能很好的满足该需求,各类用户发表的信息混杂在一起,用户需要自己去甄别其中自己感兴趣的信息。如果对社交网络特定领域中信息走向及分布特点进行准确的研究,需要对其中的影响力用户进行深度的分析挖掘,而短文本无法蕴含丰富的语义特征,这就使得很多在处理文本有较好性能的算法直接用于社交网络数据的处理并不能得到很好的效果。
发明内容
本发明实施例的目的是提供一种微博用户的潜在特征的挖掘方法及装置,能有效挖掘微博用户的潜在特征,从而为分析网络关系或推送相关资讯提供有效依据。
为实现上述目的,本发明实施例提供了一种微博用户的潜在特征的挖掘方法,包括步骤:
采集微博用户的数据;
根据所述微博用户的数据获取所述微博用户的固有属性,所述固有属性包括年龄、性别、居住地、认证信息;
根据所述微博用户的数据获取所述微博用户的行为属性,所述行为属性包括评论、点赞和转发;
根据所述微博用户的固有属性和行为属性获取所述微博用户的潜在特征。
与现有技术相比,本发明公开的微博用户的潜在特征的挖掘方法通过先采集微博用户的数据,再根据所述微博用户的数据获取所述微博用户的固有属性,接着根据所述微博用户的数据获取所述微博用户的行为属性,所述行为属性包括评论、点赞和转发,然后根据所述微博用户的固有属性和行为属性获取所述微博用户的潜在特征,能有效挖掘微博用户的潜在特征,从而为分析网络关系或推送相关资讯提供有效依据。
作为上述方案的改进,所述潜在特征包括兴趣和职业。
作为上述方案的改进,采集微博用户的数据具体为:利用大规模并行技术采集所述微博用户的数据。
作为上述方案的改进,采集微博用户的数据具体为:
接收大量所述微博用户的数据,将所述微博用户的数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份,解决了数据的消费差问题.既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,数据更可靠。
本发明实施例还提供了一种微博用户的潜在特征的挖掘装置,包括:
采集模块,用于采集微博用户的数据;
固有属性获取模块,用于根据所述微博用户的数据获取所述微博用户的固有属性,所述固有属性包括年龄、性别、居住地、认证信息;
行为属性获取模块,用于根据所述微博用户的数据获取所述微博用户的行为属性,所述行为属性包括评论、点赞和转发;
潜在特征获取模块,用于根据所述微博用户的固有属性和行为属性获取所述微博用户的潜在特征。
与现有技术相比,本发明公开的微博用户的潜在特征的挖掘装置先通过采集模块采集微博用户的数据,再通过固有属性获取模块根据所述微博用户的数据获取所述微博用户的固有属性,接着通过行为属性获取模块根据所述微博用户的数据获取所述微博用户的行为属性,所述行为属性包括评论、点赞和转发,然后通过潜在特征获取模块根据所述微博用户的固有属性和行为属性获取所述微博用户的潜在特征,能有效挖掘微博用户的潜在特征,从而为分析网络关系或推送相关资讯提供有效依据。
作为上述方案的改进,所述潜在特征包括兴趣和职业。
作为上述方案的改进,所述采集模块具体用于利用大规模并行技术采集所述微博用户的数据。
作为上述方案的改进,所述采集模块具体用于接收大量所述微博用户的数据,将所述微博用户的数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份。
附图说明
图1是本发明实施例中一种微博用户的潜在特征的挖掘方法的流程示意图。
图2是本发明实施例中一种微博用户的潜在特征的挖掘装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州特道信息科技有限公司,未经广州特道信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710580692.5/2.html,转载请声明来源钻瓜专利网。