[发明专利]一种基于图网络随机游走的风险用户预测方法在审

专利信息
申请号: 202010966200.8 申请日: 2020-09-15
公开(公告)号: CN112131569A 公开(公告)日: 2020-12-25
发明(设计)人: 易钰奇;程帆;张冬梅 申请(专利权)人: 上海交通大学
主分类号: G06F21/55 分类号: G06F21/55;G06F16/2458;G06K9/62
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 杨宏泰
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 随机 游走 风险 用户 预测 方法
【权利要求书】:

1.一种基于图网络随机游走的风险用户预测方法,其特征在于,包括以下步骤:

1)获取包含图网络化数据作为原始数据集;

2)对原始数据集进行预处理,并构建图网络;

3)对预处理后的数据通过基于随机游走的聚类算法获得节点对应的概率,即用户的风险得分;

4)整合聚类算法得到的用户节点概率,输出最后的风险用户预测结果。

2.根据权利要求1所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的包含图网络形式的数据集包括公开的比赛数据集、大学公开的数据集以及企业公开的数据集,所述的公开的比赛数据集包括Kaggle和KDD竞赛网站公开的数据集,所述的大学公开的数据集为Stanford大学开源的数据集网站上公开的数据集,所述的企业公开的数据集包括微软和雅虎企业公开的数据集。

3.根据权利要求1所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的步骤2)具体包括以下步骤:

21)从原始数据中获取特征数据,同时过滤掉噪声数据,即权重过低的边数据;

22)采用关系预测模型对可能缺失的数据进行补充;

23)对图网络中节点编号进行统一编码;

24)归一化图网络中边的权重。

4.根据权利要求3所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的步骤21)中,特征数据的类型包括数据的图节点特征、边的权重、方向特征以及作为后续随机游走初始节点而选择的风险节点。

5.根据权利要求4所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的图节点特征为用户的标签数据,表示用户的风险表现情况得分,其取值为0或1,对应有、无风险,所述的边表示用户之间的关系,包括通话关系、关注关系和社交好友关系,其权重表示用户之间关系的紧密程度。

6.根据权利要求3所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的步骤22)中,对可能缺失的数据进行补充具体包括:

对于数据:使用线性模型进行线性插值补充;

对于类别特征:选取该类别出现次数最多的特征值作为缺失值进行补充。

7.根据权利要求1所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的步骤3)中,随机游走的规则具体为:

图网络中的所有有向边作为无向边对待,对于节点之间存在多条边的情况,则将其合并为一条边,合并后该边的权重为多条边的平均值;

选择已知的风险用户作为随机游走的最开始的种子节点,根据边权重的大小,等比例的选取游走的下一个节点,当图网络中的所有节点出现在随机游走路径中的概率稳定后,停止随机游走,并且将节点对应的被访问概率作为用户的风险得分;

对于随机游走的对象,每一步随机游走均有b的概率从当前节点随机移动到当前节点的一个邻居节点上,同时有1-b的概率从当前节点直接返回到最开始的种子节点处,具体为:

rt+1=b*rt+(1-b)*r0

其中,rt表示t时刻图网络中节点r被访问的概率,r0表示最开始的种子节点被访问的概率。

8.根据权利要求7所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,概率的取值为0.9。

9.根据权利要求7所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,在随机游走的过程中,为减少计算复杂度,设置访问概率阈值δ=0.0001,当随机游走到达某个节点,该节点的访问概率不为0且小于δ时,则随机游走返回最开始的种子节点处。

10.根据权利要求9所述的一种基于图网络随机游走的风险用户预测方法,其特征在于,所述的步骤4)中,当待预测用户的风险得分超过设定的风险得分阈值时,则判断该待预测用户为风险用户。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010966200.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top