[发明专利]一种基于联邦图神经网络的多语种社交事件检测方法有效
申请号: | 202110406469.5 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113076422B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 林绅文;贺敏;毛洪亮;崔佳;徐小磊;王秀文;杨菁林 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 王顺荣 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 神经网络 语种 社交 事件 检测 方法 | ||
1.一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,包括以下步骤:
S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;
S2:添加节点边,根据社交信息添加节点之间的边;
S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型;
S4:构建三元对比损失,对于每个消息mi,称为目标消息,采样一个该目标消息的正样本和该目标消息属于同一类事件,再采样一个负样本和该目标消息属于不同类事件,这三个消息共同组成三元组mi、三元对比损失;
S5:检测阶段,基于消息学习到的表征进行消息聚类,用时序的消息流对消息图进行更新并完成每次消息流到来之后的事件检测;
S6:形成模型,利用联邦迁移学习,将模型迁移至多个语种之上;
S7:维护阶段,从消息中清除过时的消息,使用上一个阶段到达的数据对模型进行更新。
2.根据权利要求1所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述S2中将异构社交图映射成一个同构消息图,同构消息图中只包含了消息节点,如果两个消息之间有相同的属性,即有相同的用户或相同的时间戳,则在它们之间建立一条边,以此构成本方法所需要的图数据类型。
3.根据权利要求1所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述S3中学习消息表征时训练一个GNN编码器,在图神经网络中对消息的嵌入表示进行学习,将增量学习应用在模型中,当新的信息流输入模型时,模型并没有见过这些数据,此时使用注意力机制提取邻居节点信息并进行聚合,提取器和聚合器考虑的是源消息及其邻居消息的表征之间的相似性。
4.根据权利要求1所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述S5中聚类方法为DBSCAN,得到我们最终检测到的事件总数。
5.根据权利要求1所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述S6中在模型迁移时首先衡量不同语言之间的差异,基于语言之间的差异,在进行模型迁移时对模型的参数和模型的内部进行修改,最终完成模型的迁移,将用户的数据都放在本地进行训练,最终使用联邦学习将参数进行融合,形成最终的模型。
6.根据权利要求1所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述S7中维护阶段允许模型忘记过时的消息,使用最新的消息流来维护最新的模型。
7.根据权利要求6所述的一种基于联邦图神经网络的多语种社交事件检测方法,其特征在于,所述过时的消息为5-10天前的消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110406469.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种飞机前起落架
- 下一篇:一种图像描述生成方法、系统、介质及电子设备