[发明专利]一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法有效

专利信息
申请号: 202010743776.8 申请日: 2020-07-29
公开(公告)号: CN112084419B 公开(公告)日: 2023-07-28
发明(设计)人: 徐新黎;肖云月;邢少恒;杨旭华;龙海霞 申请(专利权)人: 浙江工业大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06F18/23213;G06Q50/00
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 属性 网络 嵌入 无参聚类 哔哩哔哩 用户 社团 发现 方法
【说明书】:

一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法,根据现有的哔哩哔哩用户数据构建属性网络G,将邻接矩阵和属性矩阵利用属性网络表征框架转化为嵌入向量H,对H运行k‑means算法,计算不同k值下、T次内最小的群内方差,计算I次内出现次数最多的最大和次大的曲率指标,得到对应的k值为ksubgt;a/subgt;、ksubgt;b/subgt;,分别运行IT次社团个数为ksubgt;a/subgt;和社团个数为ksubgt;b/subgt;的k‑means算法,并计算各自聚类结果最大的模块度Qsubgt;a/subgt;、Qsubgt;b/subgt;,取得Qsubgt;a/subgt;、Qsubgt;b/subgt;中较大值对应的k值作为社团划分的个数,最后利用k‑means聚类算法实现社团发现。本发明利用无参算法代替人工指定社团个数,降低了人为因素干扰,提高了社团发现的准确性和稳定性。

技术领域

本发明涉及网络科学领域,特别是一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社区发现方法。

背景技术

随着科技的快速发展,互联网极大地推动了社会各方面的发展,改变了人们生活的方方面面,以哔哩哔哩为代表的视频社交网络,成为人们日常生活娱乐休闲的重要部分。哔哩哔哩是一个深受年轻人群体喜爱的网站,兼具视频网站和社交网站两方面功能,用户可以在网站上发布、观看视频、并且对视频发布评论,同时可以关注自己喜爱的博主,可以对喜欢的视频进行点赞、投币、收藏。因此,吸引了一大批的年轻用户。哔哩哔哩上的用户社区是社交网络的一种非实体网络,在这个网络中,社团内部的成员往往会有相同或者类似的观看历史、关注。

社交网络中的网络社区具有很大的应用前景,用户可以根据自己所属社区找到有相似观看爱好的其他用户,也可以根据社区找到相似的博主,同时,哔哩哔哩网站还可以根据用户的爱好为其进行个性化推荐,甚至,可以根据划分的社团找到网站中存在的僵尸粉、机器人用户,从而进行清理,净化网络环境。由于社交网络规模较大且属性信息维度过高,传统的社团发现算法进行社团检测的难度较大,而且效率不高。

目前已经有许多社区发现算法应用于大型属性网络,如MVCC算法,SSE算法,NetFS算法等。然而这些方法对于大型的属性社区拓扑结构的信息挖掘不够深入且复杂度高,不能很好地将有同样爱好的用户划分到同一社团。

发明内容

为了克服现在大规模属性网络的社区发现方法存在的准确率不高和复杂度高等方面的缺陷,本发明提出了一种高效的基于属性网络表征学习和无参聚类的哔哩哔哩用户社团发现方法,先用属性网络表征学习框架计算每个用户的嵌入向量,然后用基于曲率和模块度的无参聚类算法确定社团划分的个数并实现社团发现,提高社团发现算法的准确率和效率。

本发明解决其技术问题所采用的技术方案是:

一种基于属性网络表征学习和无参聚类的哔哩哔哩用户社团发现方法,包括如下步骤:

步骤一:根据现有的哔哩哔哩数据,构建具有n个节点的用户网络模型G=(V,E,F),V表示节点,E表示连边,F表示属性,每个用户为一个节点,用户与用户之间若有关注,则有连边,n个节点的连边关系组成一个邻接矩阵A,每个用户的浏览历史为节点的属性,共选取m个属性,所有节点的属性表示为一个n行m列的属性信息矩阵F;

步骤二:采用属性网络表征学习方法将具有n个用户、m个属性的哔哩哔哩用户网络G转化为特征空间中n个d维嵌入向量H;

步骤三:对得到的n个嵌入向量H运行k-means算法,聚类数目k取1到kmax各T次,分别计算不同k值下、T次内的群内方差J(k),把最小的记为J(k)min

J(k)min=argminJ(k)t,1≤t≤T

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010743776.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top