[发明专利]基于CNN的社交小众用户标签挖掘及相似用户推荐方法有效
申请号: | 202010835019.3 | 申请日: | 2020-08-19 |
公开(公告)号: | CN112016003B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 陈贤;罗朗;王豪 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn 社交 小众 用户 标签 挖掘 相似 推荐 方法 | ||
本发明涉及社交网络技术处理领域,具体涉及一种基于CNN的社交小众用户标签挖掘及相似用户推荐的方法,包括:获取用户在社交软件上发布的原始内容数据,预处理;通过word2vec模型获得词向量特征;将预处理后的内容数据输入到词嵌入层,每个词取其在word2vec中的位置,寻找对应每个词的词向量;获取用户的个人属性特征向量info,并将词向量特征与个人属性特征向量info相结合构成输入矩阵;将输入矩阵输入CNN模型,获得用户的话题标签;通过聚类算法构建社交网络图,输出与用户相似的群组或用户感兴趣的群组;对用户进行话题标签推荐和群组推荐。本发明解决了社交网络上信息较少的用户的话题推荐和相关群组推荐问题。
技术领域
本发明涉及社交网络技术处理领域,具体涉及一种基于CNN的社交小众用户标签挖掘及相似用户推荐方法。
背景技术
随着社会的发展,社交软件已经成为人们交流、拓展人际关系、分享生活的热门平台之一。一些会使用社交软件的人知道如何向他人展示自己以及自己感兴趣的话题,他人可以通过系统或平台找到他们,系统也可以基于用户的个人信息以及历史数据推荐给用户可能喜欢的内容以及与该用户有相似兴趣的其他用户。但是大多数用户并没有在社交网络上展现他们的兴趣,这些用户只有少量的关注和粉丝,他们不知道自己感兴趣的话题是什么,也不经常在社交软件上发布动态,本发明称这些用户为普通小众用户。这样的用户在社交网络中占据了很大一部分,然而普通小众用户并没有受到足够的重视,而这些用户对于社交网络和推荐系统来说是非常重要的,为这些普通小众用户推荐他们感兴趣的话题和群组是很有必要的。因此需要提取能够代表这些普通小众用户的标签,从而帮助系统为小众用户推荐话题及相似用户。
标签在社交软件和网络社区中应用的很多,因为标签简而易懂。在以往的研究中,Guy和Chen提到了标签的重要性。Lee等人认为标签是社交媒体中用户与用户之间沟通的桥梁。目前,标签已经广泛应用于信息检索、推荐算法、社交网络等多个研究领域。然而在海量用户使用的标签中,很多用户自定义的标签对于其他人或者社交系统来说意义并不大。因此对于系统有用的标签占比很少,无用的标签则产生大量的噪音数据。此外,个性化属性即用户的个人属性对于用户发布内容的标签也具有一定的作用,例如:位于经济发达的沿海地区的用户发布金融方面的动态比内地用户相对较多;年轻的用户发布娱乐方面的动态比年纪大的用户相对较多;教育程度高的用户发布社会方面的动态比教育程度相对不足的用户要多。因此在提取用户代表性标签的同时,也需考虑用户的个性化属性。然而,小众用户使用的标签比活跃用户使用的少,提供的个人信息也比较少,这对提取普通小众用户的代表性标签带来了很大的困难。由于普通小众用户提供的信息比较少,很难从中发现普通用户感兴趣的群组。
发明内容
为了解决上述问题,本发明提供一种基于CNN的社交小众用户标签挖掘及相似用户推荐的方法,该方法利用卷积神经网络(CNN)自动提取高维向量特征,在CNN模型的基础上增加用户的个性化属性,提出了一种基于个性化CNN 模型的社交网络普通小众用户的标签及相似群组的推荐方法,在普通小众用户在社交软件上发布的内容中融入用户的个性化元素,并从中提取推荐能够代表用户特征的代表性标签(话题标签),进而利用聚类算法为普通用户构建社交网络图,再通过提取的代表性标签发现普通小众用户感兴趣的话题和群组推荐给用户。
一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,包括以下步骤:
获取用户在社交软件上发布的原始内容数据,对原始内容数据进行预处理,得到预处理后的内容数据;
将上述预处理后的内容数据输入到word2vec模型中,得到每一个句子中每个词的词向量表示,一个句子中每个词的词向量表示为:
其中,wordi表示第i个词,表示第i个词的向量表示,n表示一个句子共有n个词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010835019.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承装配设备上的保持架上料架
- 下一篇:金相切割机及方法