[发明专利]基于用户兴趣和社交主题提取的社交网络用户推荐方法有效
申请号: | 201610519445.X | 申请日: | 2016-07-01 |
公开(公告)号: | CN106055713B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 许可;郑栩燊;闵华清;蔡毅 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于用户兴趣和社交主题提取的社交网络用户推荐方法,包括以下步骤:获取社交网络中用户的“follower‑followee”关系以及“mutual‑following”关系信息;提取用户的社交主题和兴趣主题;在这些主题的基础上分别形成用户的社交社区和兴趣社区;将各个社区分别整理成矩阵形式,使用矩阵分解方法对各个社区矩阵进行分解以计算各用户对在各个社区矩阵的意愿关注分数,取各个用户对在所有社区的意愿关注分数的最大值为最终意愿关注分数,为目标用户排序其与其他用户的最终意愿关注分数,最终选取分数最高的TOP‑N用户为推荐关注用户。具有得到了更准确的社交网络用户推荐结果等优点。 | ||
搜索关键词: | 基于 用户 兴趣 社交 主题 提取 网络 推荐 方法 | ||
【主权项】:
1.基于用户兴趣和社交主题提取的社交网络用户推荐方法,其特征在于,包含如下步骤:步骤一、将一个社交网络中的目标用户、需要提取的用户兴趣主题个数Kin和需要提取的用户社交主题个数Kso输入UIS‑LDA主题模型,通过该模型聚类出Kin个兴趣主题和Kso个社交主题,并输出参数ζin,ζso,ε,其中,ζso表示文档在Kso个社交主题上的分布;ζin表示文档在Kin个兴趣主题上的分布;ε表示文档在贝努力变量o上的分布,o作为选择开关来指示每一篇文档的每一个followee是从一个社交主题中生成当o=0时或者是从一个兴趣主题中生成,当o=1时;表示社交主题在所有followee即被关注者上的分布;表示兴趣主题在所有followee即被关注者上的分布;步骤二、对于每一个兴趣主题z∈Zin,对应生成一个兴趣社区c∈Cin,该兴趣社区包含的follower即关注者f和followee即被关注者g分别用c.F和c.G表示如下:c.F={f|f∈F∧Pr'(z|df)≥γ},c.G={g|g∈G∧Pr'(z|dg)≥ζ},其中,F是所有follower的集合,G是所有followee的集合,f∈F表示f是集合F中的一个follower,g∈G表示g是集合G中的一个followee,γ,δ是定义好的阈值,文档df包含某个follower f关注的所有followee,文档dg包含关注某个followee g的所有的follower,Pr'(z|df)≥γ表示文档df条件下属于某个兴趣主题z的发生概率大于等于阈值γ,Pr'(z|dg)≥ζ表示文档dg条件下属于某个兴趣主题z的发生概率大于等于阈值δ,符号“∧”表示左右两边集合的合取运算,c.F={f|f∈F∧Pr'(z|df)≥γ}表示一个兴趣社区的关注者即follower集合,即c.F由满足f∈F∧Pr'(z|df)≥γ条件的所有follower f组成,c.G={g|g∈G∧Pr'(z|dg)≥ζ}表示一个兴趣社区的被关注者即followee集合,即c.G由满足g∈G∧Pr'(z|dg)条件的所有followee g组成;Zin为Kin个兴趣主题集合;Cin为Kin个兴趣社区集合;这里Pr'(z|df),Pr'(z|dg)分别用如下公式获得:其中,其中,Pr(z|df)表示文档df条件下属于某个兴趣主题z的发生概率,表示对所有z'的Pr(z'|df)取和,这里z'∈Z,Z为所有兴趣主题和社交主题组成的集合;表示将所有属于文档dg的follower f对Pr'(z|df)求和;表示先选定某个z'∈Zin,求和类似依次对各个z'∈Zin进行求和,Zin是兴趣主题的集合;对于每一个社交主题z∈Zso,对应生成一个社交社区c∈Cso,该社交社区包含的follower f和followee g分别用c.F和c.G表示如下:c.F={f|f∈F∧Pr'(z|df)≥γ},c.G={g|g∈G∧Pr'(z|dg)≥ζ},其中,F是所有follower的集合,G是所有followee的集合,f∈F表示f是集合F中的一个follower,g∈G表示g是集合G中的一个followee,γ,δ是定义好的阈值,文档df包含某个follower f关注的所有followee,文档dg包含关注某个followee g的所有的follower,Pr'(z|df)≥γ表示文档df条件下属于某个社交主题z的发生概率大于等于阈值γ,Pr'(z|dg)≥ζ表示文档dg条件下属于某个社交主题z的发生概率大于等于阈值δ,符号“∧”表示左右两边集合的合取运算,c.F={f|f∈F∧Pr'(z|df)≥γ}表示一个社交社区的关注者即follower集合,即c.F由满足f∈F∧Pr'(z|df)≥γ条件的所有follower f组成,c.G={g|g∈G∧Pr'(z|dg)≥ζ}表示一个社交社区的被关注者即followee集合,即c.G由满足g∈G∧Pr'(z|dg)条件的所有followee g组成;Zso为Kso个社交主题集合;Cso为Kso个社交社区集合;Pr'(z|df),Pr'(z|dg)分别用如下公式获得:其中,Pr(z|df)表示文档df条件下属于某个社交主题z的发生概率,表示对所有z'的Pr(z'|df)取和,这里z'∈Z,Z为所有兴趣主题和社交主题组成的集合;表示将所有属于文档dg的follower f对Pr'(z|df)求和;表示先选定某个z'∈Zso,求和类似依次对各个z'∈Zso进行求和,Zso是社交主题的集合;由此,得到用户的Kin个兴趣社区和Kso个社交社区;步骤三、对于每一个社区c∈CinUCso,把它整理成一个|c.F|×|c.G|矩阵Mc;Mc中的每一个元素用pfg表示,pfg取值如下:其中,f∈c.F表示f是集合c.F中的一个follower,g∈c.G表示g是集合c.G中的一个followee.c.F为社区c的关注者即follower集合,c.G为社区c的被关注者即followee集合;对每一个Mc执行矩阵分解算法,根据下式得到各个矩阵Mc中的follower f意愿关注分数某个followee g的分数,用C_score(f,g,c)表示:C_score(f,g,c)=xf*yg,这里,“*”号表示左右两边向量的内积,向量xf∈X|c.F|×L,向量yg∈YL×|c.G|;其中X|c.F|×L和YL×|c.G|为Mc矩阵通过矩阵分解方法得到的两个潜在矩阵,L为预先设定好的潜在空间数量,|c.F|为集合c.F的大小,|c.G|为集合c.G的大小;步骤四、按照如下公式对各个矩阵Mc相应的C_score(f,g,c)值取最大值,得到各个用户对之间的最终意愿关注分数F_score(f,g);其中,Maximum()为取最大值函数,表示对每一个社区c计算其相应的C_score(f,g,c)值;步骤五、对于每一个目标用户f,我们排序与之相关的所有的F_score(f,g),选择分数最高的N个followee g进行推荐;步骤1所述UIS‑LDA主题模型通过以下方法获得:(1)UIS‑LDA主题模型描述:把社交网络中每一个followee即被关注者g看作UIS‑LDA主题模型中一个词,每一个follower即关注者f看作模型中一篇文档df,文档中包含这个follower f关注的所有followee,数量为文档库D包含所有文档,|D|为文档个数;预先定义好需要提取的K个用户主题,这些主题被分成Kin个兴趣主题和Kso个社交主题;超参数αso为ζso上的狄利克雷先验;超参数αin为ζin上的狄利克雷先验;超参数βso为上的狄利克雷先验;超参数βin为上的狄利克雷先验;超参数∈为ε上的贝塔先验;其中,超参数αso,αin,βin,βso和∈为给定值;ζin,ζso,和ε则是需要通过模型训练获取的变量;(2)UIS‑LDA主题模型训练过程将采用生成的玻利维亚罐模型以及吉布斯采样方法来进行变量推断;在GPU模型中,罐子中包含各种颜色的球,当一个球被抓取的时候,将一定数量具有相似颜色的球连同该球一起放回罐子中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610519445.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种纸制铅笔
- 下一篇:一种微纳米切削试验装置