[发明专利]一种获取社交媒体用户画像的方法及系统在审
申请号: | 202010401788.2 | 申请日: | 2020-05-13 |
公开(公告)号: | CN113672818A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 饶育蕾;郭刚刚 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33;G06N3/04;G06N3/08;G06N20/00;G06Q40/02 |
代理公司: | 长沙智路知识产权代理事务所(普通合伙) 43244 | 代理人: | 张毅 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 社交 媒体 用户 画像 方法 系统 | ||
本发明涉及一种获取社交媒体用户画像的方法和系统,其中,所述方法包括:针对预先获取的大数据中的每一条用户信息,确定每一用户信息的特征并生成与所述特征相应的标签;根据具有标签的用户信息,训练预先设定的社交媒体用户画像预测模型获取训练后的社交媒体用户画像预测模型;获取待预测的用户信息;根据所述待预测的用户信息,采用所述训练后的社交媒体用户画像预测模型,获取待预测的用户的画像;其有益效果是,根据社交媒体用户的信息来获取社交媒体用户的画像。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种获取社交媒体用户画像的方法及系统。
背景技术
随着新浪微博、领英、推特和脸书等社交网路与社交媒体网站的爆发式发展,这些线上虚拟社交平台已经成为人们彼此连接、交流和互动的极其重要场所。越来越多的人正在通过社交媒体接受信息、表达观点、抒发情绪与激发灵感。与此同时,数以亿计的用户生成内容也成为各领域研究者,挖掘用户人口属性状况、社交行为方式、观点态度和心理情感,甚至是疾病与健康等方面的重要素材。
现有的技术中并没有根据社交媒体用户的信息来进行社交媒体用户的信用水平进行预测。
发明内容
(一)要解决的技术问题
鉴于现有技术的上述缺点、不足,本发明提供一种获取社交媒体用户画像的方法及系统,其解决了目前没有根据社交媒体用户的信息来进行获取用户画像的技术问题。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
第一方面,本发明实施例提供一种获取社交媒体用户画像的方法,所述方法包括:
S1、针对预先获取的大数据中的每一条用户信息,确定每一用户信息的特征并生成与所述特征相应的标签;
其中,所述预先获取的大数据中包括多条用户信息;
所述每一条用户信息包括用户的:职业信息数据、文本数据、人口属性数据、行为信息、关系网络信息数据;
其中,所述职业信息包括:工作经历信息、职位信息、工作地点信息、行业领域信息、工作年限和登记注册类型信息;
其中,所述文本数据包括:用户在社交媒体上发表的文本;
其中,所述人口属性数据包括:性别、注册时长、用户关注者数量、被关注者数量、用户在社交媒体上所发的文本的数量;
其中,所述行为信息数据包括:用户在社交媒体上所发表的文本的总数量、用户在社交媒体上转发的文本的数量、用户分别使用不同的终端发表文本的数量、用户在预设时间段内发表文本的数量、任一用户所发表的文本被转发的次数、任一用户所发表的文本被赞的次数、任一用户所发表的文本被评论条数;
所述关系网络信息数据:用户关注的账户以及关注所述用户账户的账户;
关系网络信息是一个社交媒体用户关注的账户,以及粉丝账户共同构成的一个社交网络结构;
S2、根据具有标签的用户信息,采用预先设定的多层深度的CNN算法针对所述具有标签的用户信息进行训练获取用于社交媒体用户画像预测的模型;
S3、获取待预测的用户信息;
S4、根据所述待预测的用户信息,采用所述训练后的社交媒体用户画像预测模型,获取待预测的用户的画像;
所述待预测的用户的画像为所述待预测的用户信息所对应的标签。
优选的,所述步骤S1包括:
针对每一用户信息中的职业信息数据,采用预先设定的第一划分规则,进行划分,确定所述每一用户信息的收入级别特征,并生成与所述收入级别特征对应的收入标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010401788.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:CMOS图像传感器及其形成方法
- 下一篇:一种吊篮用钢丝绳锁绳器