[发明专利]一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法有效
申请号: | 202010743776.8 | 申请日: | 2020-07-29 |
公开(公告)号: | CN112084419B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 徐新黎;肖云月;邢少恒;杨旭华;龙海霞 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F18/23213;G06Q50/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 网络 嵌入 无参聚类 哔哩哔哩 用户 社团 发现 方法 | ||
1.一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社区发现方法,其特征在于:所述方法包括如下步骤:
步骤一:根据现有的哔哩哔哩数据,构建具有n个节点的用户网络模型G=(V,E,F),V表示节点,E表示连边,F表示属性,每个用户为一个节点,用户与用户之间若有关注,则有连边,n个节点的连边关系组成一个邻接矩阵A,每个用户的浏览历史为节点的属性,共选取m个属性,所有节点的属性表示为一个n行m列的属性信息矩阵F;
步骤二:采用属性网络表征学习方法将具有n个用户、m个属性的哔哩哔哩用户网络G转化为特征空间中n个d维嵌入向量H;
步骤三:对得到的n个嵌入向量H运行k-means算法,聚类数目k取1到kmax各T次,分别计算不同k值下、T次内的群内方差J(k),把最小的记为J(k)min;
J(k)min=argminJ(k)t,1≤t≤T
其中,Pj为社团j的节点集合,Xi为社团j内节点i的嵌入向量H,为社团j的各节点向量平均值,||x||2为求x的欧式距离的平方;
步骤四:计算曲率指标r(k);
步骤五:把最大的曲率指标r(k)对应的k记为k1,把次大的曲率指标r(k)对应的k(k≠k1)记为k2,以上步骤循环I次,把出现次数最多的k1和k2分别记为ka、kb;
步骤六:分别运行社团个数为ka和社团个数为kb的k-means算法,并计算各自聚类结果的模块度Q1、Q2,模块度Q的公式为;
其中,c为社团序号,C为社团个数,lc是社团c的总边数,dc是社团c中所有用户的总度数,m为整个网络用户之间的总边数;
步骤七:对步骤六循环执行IT次,对Q1、Q2分别取最大值记为Qa、Qb,对比得到最终的社团划分个数K;
步骤八:运行社团个数为K的k-means算法,返回哔哩哔哩用户的社团划分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010743776.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有除尘机构的竹制品加工用竹条打磨装置
- 下一篇:智能减重步态训练器