[发明专利]基于动态多视图学习模型的社交网络用户多标签分类方法有效
申请号: | 201910493547.2 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110263236B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 王莉;郑婷一;孟燕霞 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q50/00 |
代理公司: | 太原高欣科创专利代理事务所(普通合伙) 14109 | 代理人: | 冷锦超;安丽荣 |
地址: | 030024 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 视图 学习 模型 社交 网络 用户 标签 分类 方法 | ||
本发明提供了基于动态多视图学习模型的社交网络用户多标签分类方法,包括如下步骤:针对特定社交网络数据集,构建用户的多视图表征;基于用户表征,构建多视图数据间深度融合表征模型;采用动态路由模型,更新参数并优化多视图特征;引入共享表征模型,对步骤三中的特征,构建目标函数。通过模型优化,并得到最优共享表征矩阵,最终利用共享矩阵实现任意用户的多标签分类。本方法实现了网络用户的多标签高效分类,解决了数据缺失导致模型学习性能下降、视图融合数量受限和模型无法满足多分类任务需求等问题,可以广泛应用于网络中用户精准分析、异常用户检测、用户关系挖掘、未知用户识别等场景。
技术领域
本发明基于动态多视图学习模型的社交网络用户多标签分类方法,属于信息技术服务领域。
背景技术
目前互联网已成为了人们生活必不可少的部分,用户在不同社交网络(如微博、twitter、微信)中产生了大量的文本、图像、用户关系等数据,称为多视图数据。这些多视图数据隐含了丰富的信息,而且更新速度极快,因此,多视图数据的融合也成为了数据挖掘领域的一个关键技术问题,其研究成果可应用于不同的领域。网络用户分析作为一个重要的应用场景,用户可能同时具有多个类别标签,近年来,不同网络上同一用户的多标签分类受到了研究团队的广泛关注。
据调研,受网络用户数据多源、多模特点的制约,现有多标签分类方法依然存在以下不足:(1)多标签预测性能过度依赖于用户数据,在部分视图数据缺失的情况下,模型的学习性能会明显下降;(2)受模型的限制,大多数方法只实现了两视图的融合学习;(3)部分新的方法可实现多视图的融合,并取得了较好的性能,但完成的是聚类任务,难以实现最优的多标签分类模型。为了解决以上问题,本发明基于多视图子空间算法,构建了动态多视图学习模型实现了用户的多标签分类任务。
发明内容
本发明克服了现有技术存在的不足,提供了基于动态多视图学习模型的社交网络用户多标签分类方法,尤其是基于动态多视图学习模型的社交网络用户多标签分类方法,该方法能够充分融合用户的多视图数据,优化视图表征,实现网络用户的多标签分类,也可应用其他领域中的多视图数据分析。
本发明是通过以下技术方案实现的,
基于动态多视图学习模型的社交网络用户多标签分类方法,包括如下步骤:
步骤一,针对特定社交网络数据集,构建用户的多视图表征矩阵:
社交网络数据一般包括用户个人信息和用户与用户关系两种模态的数据,构成了用户的多视图表示,其中,用户个人信息称为节点属性,关系称为节点间的边;
所述的用户多视图表示过程包括以下步骤:
首先,学习社交网络数据集中节点属性的表征,得到节点的特征向量,构成了该节点第一个视图;
然后,学习社交网络数据集中节点间边的表征,即节点的结构表征向量,构成了该节点第二个视图;
最终,节点和节点间边的表征共同构成了所述用户的全部视图表征矩阵;
步骤二,构建用户多视图数据的深度学习模型:
采用多层感知器模型(MLP)分别对步骤一得到的全部视图的表征矩阵进行深度学习,深度学习过程中的参数权重w不断优化,最后得到全部视图的深度表征,并分别对各个视图的深度表征进行平均中心化,实现每个视图的非线性映射表征,并将得到的平均中心化表征作为第三步多视图学习模型的输入特征;
步骤三,多视图学习模型采用动态路由模型,更新参数并优化多视图表征矩阵;
步骤二的输出作为步骤三的输入,将其多视图表征矩阵的更新优化作为一个独立的任务,每个任务采用动态路由模型来学习对应特征中的活跃向量,并将所述活跃向量作为对应特征的最优向量表征;
步骤四,利用共享表征模型,构建目标函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910493547.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送对象更新方法、装置和计算机设备
- 下一篇:舆情数据的获取方法和装置