[发明专利]面向不同社交媒体平台用户活动领域类别划分方法在审

专利信息
申请号: 202010831310.3 申请日: 2020-08-18
公开(公告)号: CN112214575A 公开(公告)日: 2021-01-12
发明(设计)人: 陶婉琼;琚春华 申请(专利权)人: 浙江工商大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/247;G06F40/284;G06Q50/00
代理公司: 杭州裕阳联合专利代理有限公司 33289 代理人: 司晓蕾
地址: 310016 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 不同 社交 媒体 平台 用户 活动 领域 类别 划分 方法
【说明书】:

发明公开了面向不同社交媒体平台用户活动领域类别划分方法,包括以下步骤:S1:获取社交网络用户活动数据,并对数据预处理;S2:TF‑IDF词频转化,将用户活动文档文本转换成词频TF‑IDF矩阵;S3:用户活动内容聚类;S4:停用词表扩充,而后采用该停用词表再一次对用户活动文档数据集做去停用词处理,并重复S2‑S4步骤,直到最佳聚类结果的词云图中不再含有干扰词为止;S5:社交媒体平台活动领域类别划分,基于最新的词云图,采用人工标记的方法对活动领域类别进行归纳。本发明中,增强活动领域分类处理的科学性和合理性,显著提高分类的准确性,实现准确、便捷地确定社交网络中用户活动领域类别。

技术领域

本发明涉及互联网技术以及信息处理技术领域,尤其涉及面向不同社交媒体平台用户活动领域类别划分方法。

背景技术

随着社交网络的发展,网络上的信息内容呈爆炸式的增长,这与用户获取信息的能力形成巨大的反差,因此,为了提高用户获取所需信息的效率,基于社交网络逐渐发展出了个性化推荐服务。个性化推荐服务是以用户对不同领域的需求和偏好为主要依据,且其中涉及到活动领域的划分这一重要的基础内容。

社交网络的出现对于互联网时代具有重要的意义,为人们进行信息传递与获取开辟了重要渠道。目前,世界上最大的社交网站是Facebook,至2019年,该平台每月活跃用户已达24.5亿人。社交网络的迅速崛起对人们的生活产生了重大的影响,随之出现了用户个性化推荐、社交电商等,而这些新形势的营销与推荐服务方法都是以用户兴趣、偏好和需求为基础进行计算的,其中不可避免地涉及对不同活动领域的探讨。通常情况下,一个用户往往会涉足多个不同的活动领域,对某一活动领域偏爱的程度越深,针对这一领域进行推荐,被接受的概率更高,在实际社交场景中,用户会进行多种活动,如发表动态内容、与其他用户展开交互活动,包括点赞、评论、转发和收藏等。用户的所有活动内容代表了社交网络平台中涵盖了的所有活动领域,因此对用户活动内容进行分析,便能够实现对活动领域的识别。由于用户活动内容涉及大量的文本信息数据,因此需要结合自然语言处理方法对用户动态发表内容和交互活动内容的文本进行分析,以实现对社交网络中活动领域科学合理的分类。

目前,已有研究大多是基于专家系统对社交网络中的活动领域进行分类,但是受个人认知的局限,存在分类准确性不高的缺陷,并且对于不同类型的社交媒体平台,由于面向对象及内容的不同,涉及的活动领域一般存在不同程度的差别,因此对不同社交媒体平台采用相同的活动领域分类方案是不合理的,需要一种更为科学合理,可以适用于不同社交媒体平台的活动领域分类方法。

发明内容

本发明的目的在于克服现有方法的不足之处,提出一种面向不同社交媒体平台用户活动领域类别划分方法。

为了实现上述目的,本发明采用了如下技术方案:面向不同社交媒体平台用户活动领域类别划分方法,包括以下步骤:

S1:获取社交网络用户活动数据,并对数据预处理,其中,数据预处理包括对数据进行去杂数据和特殊符号、中文分词和去停用词处理;

S2:TF-IDF词频转化,将用户活动文档文本转换成词频TF-IDF矩阵;

S3:用户活动内容聚类;

S4:停用词表扩充,而后采用该停用词表再一次对用户活动文档数据集做去停用词处理,并重复S2-S4步骤,直到最佳聚类结果的词云图中不再含有干扰词为止;

S5:社交媒体平台活动领域类别划分,基于最新的词云图,采用人工标记的方法对活动领域类别进行归纳。

作为上述技术方案的进一步描述:

所述步骤S1中去杂数据和特殊符号具体方法为:采用删除法,将所获取的存在缺失的数据删除,只关注用中文撰写的活动内容,删除用英文、韩文、日文等其他语言撰写的发表动态内容和评论数据,并通过建立特殊符号列表的方法进行去除文本中包含的特殊符号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010831310.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top