[发明专利]基于CNN的社交小众用户标签挖掘及相似用户推荐方法有效
申请号: | 202010835019.3 | 申请日: | 2020-08-19 |
公开(公告)号: | CN112016003B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 陈贤;罗朗;王豪 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/33;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cnn 社交 小众 用户 标签 挖掘 相似 推荐 方法 | ||
1.一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,包括以下步骤:
获取用户在社交软件上发布的原始内容数据,对原始内容数据进行预处理,得到预处理后的内容数据;
将预处理后的内容数据输入到word2vec模型中,得到每一个句子中每个词的词向量表示,一个句子中每个词的词向量表示为:
其中,wordi表示第i个词,表示第i个词的向量表示,n表示一个句子共有n个词;
取每个词在word2vec模型中对应的词向量进行拼接,获得一个句子的词向量特征矩阵,词向量特征矩阵表示如下:
其中,Sw表示词向量特征矩阵,en表示第n个词的向量表示,n表示Sw一共划分出n个词;
获取用户的个人属性特征向量info,将词向量特征与用户的个人属性特征向量info相拼接,构成输入矩阵;
将输入矩阵输入CNN模型,在CNN模型中通过卷积、池化、全连接层的计算,最终输出用户的代表性标签,即用户的话题标签;
根据CNN模型输出的用户的代表性标签,通过聚类算法构建社交网络图,输出与用户相似的群组或用户感兴趣的群组,对用户进行话题标签推荐和群组推荐。
2.根据权利要求1所述的一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,所述预处理包括:对于原始内容数据中的每个句子,首先进行分词处理,提取分词,然后从提取的分词中删去停止词以及无意义的词组,保留有意义的词组,得到预处理后的内容数据,预处理后的内容数据表示为:Sw=[w1,w2,...,wn],其中,Sw表示原始内容数据中的任意一条内容数据,wn表示划分后的第n个词组,n表示一条内容数据共划分n个词。
3.根据权利要求1所述的一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,用户的个人属性特征向量info为用户年龄向量age、用户的教育程度向量education以及用户的所在地向量place拼接而成的向量,用户年龄向量age、用户的教育程度向量education以及用户的所在地向量place分别表示如下:
age=(a1,a2,...,ax),x∈用户的年龄取值总数
education=(edu1,edu2,...,eduy),y∈用户的教育程度取值总数
place=(p1,p2,...,pz),z∈用户的所在地取值总数
其中,ax表示第x个年龄表示,x表示一共有x种年龄的取值,eduy表示第y种教育程度表示,y表示一共有y种教育程度的取值,pz表示第z种用户所在地,z表示一共有z种用户所在地。
4.根据权利要求1所述的一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,所述输入矩阵为:其中,Sw表示词向量特征矩阵,info表示用户的个人属性特征向量。
5.根据权利要求1所述的一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,通过聚类算法构建社交网络图具体包括:
首先根据用户的代表性标签计算两两用户之间的相似度;
再根据两两用户的相似度值,采用聚类算法对相似度高的用户进行聚类,得到用户感兴趣的话题和群组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010835019.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承装配设备上的保持架上料架
- 下一篇:金相切割机及方法