[发明专利]一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法有效

专利信息
申请号: 201610907676.8 申请日: 2016-10-19
公开(公告)号: CN106570082B 公开(公告)日: 2019-11-05
发明(设计)人: 宣琦;赵明浩;周鸣鸣;虞烨炜;傅晨波;俞立 申请(专利权)人: 浙江工业大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法,包括以下步骤:1)建立朋友关系网络图,随机选取其中90%的朋友关系连边数据为训练集,剩余的10%作为测试集;2)构建两种基于拓扑相似度的朋友关系网络的有权无向图;3)构建两种基于用户行为特征相似度的朋友关系网络的有权无向图;4)使用基于加权模块度的社团检测算法(CNM算法)分别对上述四种有权无向图进行社团划分,如果任意两个用户在上述四种社团划分过程中至少有三次或以上被划为同一个社区,则认为这两个用户是朋友关系。本发明将拓扑特征以及行为特征引入到用户朋友关系网络中,通过社团划分,挖掘出两个用户是否是朋友关系。
搜索关键词: 一种 结合 网络 拓扑 特征 用户 行为 朋友 关系 挖掘 方法
【主权项】:
1.一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法,其特征在于:所述挖掘方法包括以下步骤:S1:数据集提供包括朋友网络与就餐地点、口味信息,首先建立朋友关系网络图,随机选取其中设定比例的朋友关系连边数据为训练集,剩余部分作为测试集;S2:根据训练集建立朋友关系无权无向图G1=(V,E1),图G1的邻接矩阵Av×v=(aij)v×v,i,j∈{1,2,...,v},v表示用户个数,其中:根据邻接矩阵Av×v=(aij)v×v,i,j∈{1,2,...,v}分别求出如下两种网络拓扑特征:资源分配指标RAv×v,Jaccard指标Jv×v,分别得到下列各拓扑特征矩阵:RAv×v=(RAij)v×v,Jv×v=(Jij)v×v,i,j∈{1,2,...,v},如下为各特征矩阵元素表达式:其中Γ(i)为节点i的邻居节点的集合,k(z)=|Γ(z)|为节点z的度,各特征矩阵RAv×v,Jv×v线性归一化分别为特征矩阵各元素线性归一化结果为:如上将朋友关系的无权无向图G1分别转化为两种有权无向图,其中权值分别等于上述两种归一化后的特征矩阵的值,即S3:通过用户已有的就餐地点与口味行为的记录数据,分别建立两类二分图,即用户‑餐馆地区,用户‑口味标签,过程如下:定义餐馆二分图G=(X,E,R),其中Xi={x1,x2,...,xv},i∈{1,2,...,v}表示v个用户,Ri={r1,r2,...,rn},i∈{1,2,...,n}表示n个餐馆,若用户xi,i∈{1,2,...,v}去过餐馆rj,j∈{1,2,...,n},则用有权连边表示该用户去了几次该餐馆,权值为dij,i∈{1,2,...,v},j∈{1,2,...,n},即去过的次数,同理,构建用户‑口味标签二分图G(X,E',T),其中Xi={x1,x2,...,xv},i∈{1,2,...,v}表示v个用户,Ti={t1,t2,...,tm},i∈{1,2,...,m}表示m个口味标签,若用户xi选择口味tj,j∈{1,2,...,m},则用有权连边表示该用户选择了几次该口味,权值为d'ij,i∈{1,2,...,v},j∈{1,2,...,m},即选择的次数;所述S3包括以下步骤:S3‑1:分别根据用户‑餐馆与用户‑口味标签的二分图,计算出任意两个用户的节点相似度,用于表征两个用户之间的行为差异,其中dij表示用户xi去餐馆rj的次数,则用户xi去餐馆rj的概率为:其中,k=1,2,…,|v|,表示所有的用户;根据不相关熵的定义,餐馆rj的熵为:其中,Ej值越大,表示餐馆rj越受用户欢迎;用户xi,xj选择餐馆的特征相似度RSIM定义为:特征矩阵各元素线性归一化结果为:同理,在用户‑口味标签二分图中,d'ij表示用户xi尝过口味tj的次数,则用户xi尝过口味tj的概率为:根据不相关熵的定义,口味tj的熵为:其中,E′j值越大,表示口味tj越受用户欢迎;则用户选择餐馆在口味上的相似度特征(TSIMij)定义为:特征矩阵各元素线性归一化结果为:S3‑2:根据上述两种用户行为特征重新构建朋友网络,即有权无向图G2=(V,E2),过程如下:保留用户节点,删除所有朋友连边,两点之间是否有连边以及连边的权值取决于用户行为特征相似度,其中朋友网络的连边E2的权值分别取自于上述两个特征矩阵即S4:使用基于加权模块度的社团检测算法分别对上述四个有权无向图进行社团划分,如下为加权无向网络的模块度公式为:其中,W是网络中所有边的权值之和,si是节点的强度,即与节点i相连的所有边的权重和,wij是网络中节点i与节点j之间的连边的权值,sisj/(2W)是相应的零模型中节点i与节点j之间的连边的期望的权值,Ci与Cj分别表示节点i与节点j在网络中所属的社团:如果这两个节点属于同一社团,则δ(Ci,Cj)=1;否则值为0,所述S4包括以下步骤:S4‑1:初始化:初始时假设每个节点就是一个独立的社团,即m个社团,选取基于的有权无向图为对象,该网络所有边的权值之和为W1,此时模块度值Q=0,定义对称矩阵Fv×v,其中的元素fij表示连接社团和社团中的边权值占所有边权值的比例;定义行的加总它表示所有连接了社团中的节点的边权值占总权值的比例,矩阵F和辅助向量的元素为fij和ai,初始的fij、ai计算如下:ai=si/(2W1)其中,fij的非零值是根据所基于的不同特征即拓扑特征、行为特征的有权无向图对象决定,初始的模块度增量矩阵ΔQ的各元素计算如下:得到初始模块增量矩阵以后,就能得到由它每一行的最大元素构成的最大堆H;S4‑2:从最大堆H中选择max{ΔQij},合并相应的社团Gi和Gj,标记合并后的社团标号为j;并更新模块度增量矩阵ΔQ、最大堆H和辅助向量S4‑2‑1:ΔQ的更新:删除第i行和第i列的元素,更新第j行和第j列的元素,得到S4‑2‑2:最大堆H的更新:在更新ΔQ后,要更新最大堆中相应的行和列的最大元素;S4‑2‑3:辅助向量的更新如下:aj←ai+aj,然后ai=0并记录合并以后的模块度值:Q←Q+max{ΔQij}S4‑2‑4:重复步骤S4‑2‑2直到网络中所有的节点都归到一个社团内;当模块度增量矩阵中最大的元素由正变为负,就停止合并,并认为此时的结果就是基于的有权无向图网络的社区结构C1;S4‑3:选取基于的有权无向网络为对象,重复S4‑1过程,就能得到基于的有权无向网络的社区结构C2,C3,C4;S4‑4:根据以上基于四种不同特征包括网络拓扑特征以及用户行为特征的网络社团结构,即C1,C2,C3,C4,如果任意两个用户两点在上述四种社团划分过程中至少有三次或以上被划为同一个社区,则认为这两个用户是朋友关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610907676.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top