[发明专利]基于层次化主题偏好语义矩阵的关注关系识别及标注方法有效
申请号: | 202010483759.5 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111723301B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 郑建兴;李沁文;李德玉;梁吉业 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/289;G06F40/30;G06F16/33;G06Q50/00 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 程园园 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 主题 偏好 语义 矩阵 关注 关系 识别 标注 方法 | ||
本发明属于社交网络可解释性链路预测方法技术领域,公开了基于层次化主题偏好语义矩阵的关注关系识别及标注方法,首先针对社交用户关注关系网络图以及用户文本内容数据,构建学习层次化主题偏好语义矩阵,并通过层次化主题和偏好语义矩阵标注网络节点关注关系,通过用户文本内容解释偏好语义矩阵;接着通过层次化主题偏好语义矩阵计算新用户与其他用户之间的关注关系相关性,将相关性高的用户识别为具有关注关系,通过层次化主题和偏好语义矩阵标记关注关系,依据用户文本内容解释偏好语义矩阵。本发明从层次化主题方面预测了用户关注关系,提高了社交网络用户关注关系识别的准确率,尤其是在网络诈骗团伙异地社交关注关系识别方面提供极大支持。
技术领域
本发明涉及社交网络可解释性链路预测方法技术领域,具体涉及基于层次化主题偏好语义矩阵的关注关系识别及标注方法。
背景技术
在社交网络中,用户之间的关注关系能够形成关注网络结构。在许多的关注关系社交网络中,用户可能对不同类型的主题和不同层次的主题具有不同的兴趣点,通过探索用户间关注关系在不同类型主题以及不同层次主题下的隐含语义联系,可以深入挖掘用户的关注关系兴趣动机所在,从而更容易发现用户的潜在关注用户,建立更可信的关注关系预测解释。一位用户关注了另一位用户,则可能转发该用户的微博内容,或点赞该微博内容。通过分析两个用户发布的微博内容,能够在某些潜在的共同兴趣特征上发现语义相似性,预测用户之间的关注行为;同时用户的兴趣具有层次化结构,两个在CBA主题上建立关注关系的用户比两个在篮球主题上建立关注关系的用户更具有语义的解释性。基于用户间潜在兴趣主题提取细粒度的可解释性的关注关系原因能够提升推荐系统链路预测的性能。
社交网络中的关注关系链路预测通常依赖于网络结构,基于网络结构的标注技术分析了用户之间的链接影响力,忽略了用户的微博内容中丰富的兴趣信息;基于用户行为记录的关注关系技术侧重于利用用户显式的主题关键词标注。另一方面,社交网络用户的兴趣具有多样化,具有多层次化,例如,关注者用户发布的微博内容包含了体育关键词,被关注者用户发布的微博内容包含了篮球、CBA等主题词,则通过主题词体育、篮球、CBA之间的潜在语义关系可以提取及解释标注用户间的关注关系行为。因此,如何根据用户的微博内容,挖掘用户间潜在语义兴趣的动机,在层次化兴趣主题偏好语义矩阵上学习用户间的关注关系,进而实现在细粒度兴趣主题方面的用户网络关注关系预测,完成可解释的精准的用户关注关系链路预测是十分必要的。
发明内容
针对上述问题本发明提供了基于层次化主题偏好语义矩阵的关注关系识别及标注方法。
为了达到上述目的,本发明采用了下列技术方案:
基于层次化主题偏好语义矩阵的关注关系识别及标注方法,包括以下步骤:
步骤S1,构建主题偏好语义矩阵初始化的关注关系网络图;
步骤S2,学习基于翻译模型的层次化主题偏好语义矩阵;
步骤S3,通过偏好语义矩阵标注网络节点关注关系;
步骤S4,基于用户文本内容解释层次化主题偏好语义矩阵;
步骤S5,计算新用户与其他用户节点在层次化主题下的相关性;
步骤S6,选取具有最大相关性的层次化主题标注用户间关注关系;
步骤S7,标记关注关系的层次化主题偏好语义矩阵;
步骤S8,依据用户文本内容解释偏好语义矩阵。
进一步,所述步骤S1,构建主题偏好语义矩阵初始化的关注关系网络图还包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010483759.5/2.html,转载请声明来源钻瓜专利网。