[发明专利]一种基于图卷积网络的社交平台用户职业预测方法有效
申请号: | 202011404011.8 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112528163B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 周凡;马英洵;陈湘萍 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/951;G06Q50/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 网络 社交 平台 用户 职业 预测 方法 | ||
1.一种基于图卷积网络的社交平台用户职业预测方法,其特征在于,所述方法包括:
数据收集及预处理,爬取社交平台中的用户数据,其中用户数据包括用户基本数据以及社交网络数据,用户基本数据包括用户的基本属性、行为属性,社交网络数据包括用户好友列表以及好友列表用户的基本属性,被搜集了行为属性及好友列表的用户为主用户,好友列表用户为相关用户;
对所述社交网络数据中所述相关用户进行数据过滤,仅保留在5个及以上主用户的好友列表中出现过的相关用户作为所述主用户的相邻节点,若进行数据过滤后所述主用户的相关用户都被过滤掉,则直接用该主用户原有相关用户作为该主用户的相邻节点,之后最终确定的相邻节点与所述主用户节点构建网络结构邻接矩阵;
构建bag-of-words的词库,之后将所述相关用户的基本属性中的个人简介通过该bag-of-words表示,构建与所述网络结构邻接矩阵结构相同的节点属性特征矩阵;
将所述网络结构邻接矩阵以及所述节点属性特征矩阵输入图卷积网络模型进行学习,对模型参数进行学习调整之后得到网络特征向量;
对所述主用户的基本属性和行为属性进行预处理,构造主用户属性特征向量;
将所述网络特征向量和所述主用户属性特征向量进行拼接,得到最终代表主用户特征的主用户特征向量;
将所述主用户特征向量输入逻辑斯特回归分类器,对逻辑斯特回归分类器进行训练之后得到最终的职业分类模型;
将待预测职业的社交平台用户数据输入所述职业分类模型,模型输出结果即为预测得到的用户职业。
2.如权利要求1所述的一种基于图卷积网络的社交平台用户职业预测方法,其特征在于,所述数据收集及预处理阶段,需要根据所述用户基本属性标定其所属职业用于训练,职业划分按照《中华人民共和国职业分类大典》分为8大类,用数字表示,分别为:0-各类专业及技术人员、1-国家党政机关或企事业单位人员、2-办事人员和有关人员、3-商业工作人员、4-服务性工作人员、5-农林牧渔劳动者、6-生产工作/运输工作和部分体力劳动者、7-不方便分类的其他劳动者。
3.如权利要求1所述的一种基于图卷积网络的社交平台用户职业预测方法,其特征在于,所述构建bag-of-words的词库,之后将所述相关用户的基本属性中的个人简介通过该bag-of-words表示,构建与所述网络结构邻接矩阵结构相同的节点属性特征矩阵,具体为:
将包括所述主用户与所述相关用户在内的所有用户的个人简介作为语料库,对语料库进行分词、去停词之后保留出现频率最高的5000个词,作为bag-of-words的词库;
将用户的个人简介用bag-of-words表示得到用户节点的属性特征,构建与所述网络结构邻接矩阵结构相对应的节点属性特征矩阵,矩阵结构为dN*df,其中N表示用户节点数量,f表示特征数量。
4.如权利要求1所述的一种基于图卷积网络的社交平台用户职业预测方法,其特征在于,所述将所述网络结构邻接矩阵以及所述节点属性特征矩阵输入图卷积网络模型进行学习,对模型参数进行学习调整之后得到网络特征向量,具体为:
将所述网络结构邻接矩阵以及所述节点属性特征矩阵的集合划定为训练集和测试集;
图卷积网络模型表示为f(H(l),A),其中H(0)=X是所述节点属性特征矩阵,A是所述网络结构邻接矩阵:
其中,是A+λI的度矩阵,即I是单位矩阵,λ是控制节点权重的超参数,W(l)和b(l)分别是第l层的可训练参数以及偏置值,σ为非线性激活函数;
在图卷积网络模型的每一层中,每个节点通过聚集其邻接节点的特征,再通过W和b进行线性转化;
图卷积网络模型的输入为所述网络结构邻接矩阵和所述节点属性特征矩阵,采用3层卷积层,激活函数选择ReLU,得到网络特征向量:
在训练过程通过调整参数使预测结果拟合程度更高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011404011.8/1.html,转载请声明来源钻瓜专利网。