[发明专利]一种基于社区检测的多标签分类方法在审
申请号: | 201910041884.8 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109711485A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 廖祥文;聂煜;陈志豪;陈国龙 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签分类 社区发现 嵌入的 节点向量 目标函数 社区 非线性映射函数 数据预处理模块 高斯混合模型 分类函数 分类结果 联合节点 目标节点 嵌入模块 融合模块 输出模块 属性信息 数据集中 网络节点 向量特征 输出层 输入层 检测 邻域 嵌入 反馈 | ||
本发明涉及一种基于社区检测的多标签分类方法,包括一个数据预处理模块,用于得到网络节点表示;一个社区发现模块,利用一个基于高斯混合模型的目标函数同时来进行社区发现和嵌入;一个节点嵌入模块,利用一个非线性映射函数连接的深层模型,来表示节点向量,模型的输入层包括来自目标节点及其邻域的属性信息,输出层表示节点的向量特征;一个融合模块,定义了一个社区发现和嵌入的目标函数,并联合节点嵌入的信息进行反馈,得到最终的节点向量表示;一个分类结果输出模块,用分类函数得到节点最终的多标签分类结果。本发明,能够结合社区发现和社区嵌入的方法,能够较好的从数据集中将节点进行标签分类。
技术领域
本发明涉及多标签分类分析领域,特别是一种基于社区检测的多标签分类方法。
背景技术
当前,存在着一些基于网络表示学习的多标签分类分析方法。基于矩阵特征向量计算,通过计算关系矩阵的前k个特征向量或奇异向量来得到k维的节点表示。利用“非线性降维的全局几何框架”计算出了全局最优解的Isomap算法。通过分析高维度的流行,从而找到与之对应的低纬度的嵌入,在计算高维度节点之间的距离时,提出了用实际输入数据来估算其测地线距离的算法,代替了传统的欧式距离,并保证了近似收敛到原始高维数据的真实结构。
还存在着一些基于随机游走的多标签分类分析方法。研究者将词嵌入技术应用于网络或图节点的特征学习。通过实验验证了随机游走序列中节点和文档中的单词一样都遵从指数定律(power-law),从而进一步将著名的词表示学习算法word2vec应用在随机游走序列上,学习节点表示。
当前,有很多技术方法可用于网络中节点的多标签分类分析。传统的多标签分类算法是将多标签学习问题转换为多类(单标签)分类问题。将训练数据集中的标签集合子集进行二进制编码,每个编码值看作是单标签分类任务中的多类分类问题的不同类别值,然后,训练多类分类器。当给定一个未知样本时,首先根据训练得到的多类分类器对其进行预测,然后将预测出的结果转成二进制编码,从而得到其所属的类别标签集合。这个方法比较简单,但如果当标签类别的数量很多时,将其转换为新的类别标签时值的数量会增加很多,从而导致这些类别标签的训练样本不足以及训练时间开销大。
发明内容
有鉴于此,本发明的目的是提出一种基于社区检测的多标签分类方法,能够改善网络中节点的多标签分类效果。
本发明采用以下方案实现:一种基于社区检测的多标签分类方法,提供一数据预处理模块用以获得网络节点表示;提供一社区发现模块用以进行社区发现和嵌入;提供一节点嵌入模块用以进行节点相量的表示;提供一融合模块用以得到最终的节点相量表示;提供一分类结果输出模块用以得到最终的多标签分类结果;
利用上述各模块进行多标签分类具体包括以下步骤:
步骤S1:提供一社交网络数据集,所述数据预处理模块对所述社交网络中结构进行节点和边的表示;
步骤S2:所述社区发现模块利用基于高斯混合模型(GMM)的目标函数进行社区发现和社区嵌入;
步骤S3:所述节点嵌入模块利用非线性映射函数连接的深层模型,表示初始节点向量;
步骤S4:所述融合模块将步骤S2中所述的社区发现和社区嵌入以及步骤S3中所述的节点的向量表示即节点嵌入信息进行融合,得到最终节点相量;
步骤S5:所述分类结果输出模块利用分类函数对步骤S4得到的最终节点相量进行分类,获得节点最终多标签分类结果。
进一步地,所述深层模型的输入和输出通过非线性映射函数连接;所述深层模型的输入层包括来自目标节点及其邻域的属性信息,输出层表示节点的向量特征。
进一步地,所述深层模型的输入层位于所述深层模型的左侧,是所述深层模型的监督学习组件,通过标记数据进行训练,用以预测类标签;所述输出层位于所述深层模型的右侧,用以预测网络输入的上下文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041884.8/2.html,转载请声明来源钻瓜专利网。