[发明专利]一种城市异构节点分类的图网络结构方法在审
申请号: | 202010736888.0 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111881303A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 高扬;韩晓宇;王竞;王丹 | 申请(专利权)人: | 内蒙古众城信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06N3/04;G06Q50/26 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 014030 *** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 城市 节点 分类 网络 结构 方法 | ||
1.一种城市异构节点分类的图网络结构方法,其特征在于:包括如下步骤:
步骤一:获取构建城市异构图所需的数据以及标签信息并构建城市异构图;
步骤一,具体包括如下子步骤:
步骤1.1:收集投诉过事件市民的相关数据以及市民所在地区范围内所有活跃设施的地理位置坐标序列;
其中,市民的相关数据包括投诉事件类型、微博或各种地图软件的账号;
步骤1.2:基于步骤1.1中微博或各种地图软件的LBS获取市民的轨迹数据;
步骤1.3:根据步骤1.1中所有活跃设施的地理位置坐标收集对应设施的标签信息;
步骤1.4:将步骤1.2轨迹数据中的市民和步骤1.3中的活跃设施分别抽象为用户节点和位置节点,基于轨迹数据构建城市异构图;
步骤二:对城市异构图进行预处理,获得输入数据的集合,具体包括如下子步骤:
步骤2.1:在城市异构图中,以用户节点为中心,R为半径提取一个局部子图;
步骤2.2:将局部子图中所有节点的标签抽取出来,组成一个和局部子图对应的节点标签集,并将该节点标签集中的标签进行分类判决为两类标签;
其中,节点标签集中包括已知事件的标签和最新事件的标签;
步骤2.3:将步骤2.1提取的局部子图和步骤2.2组成的节点标签集组合为一个数据对;
步骤2.4:再重复步骤2.1到步骤2.3共K-1次,共获得包含K个数据对的输入数据集;
至此,经过步骤一和步骤二,获得了输入数据集,用于后续预训练和微调;
步骤三:根据得到的输入数据集构建前预训练模型;
所述前预训练模型的功能为:通过自监督的方式挖掘节点之间的结构信息;
其中,构建的前预训练模型包括图分割模块、中心子图特征提取模块、上下文子图特征提取模块和自监督学习模块;
其中,中心子图特征提取模块包括GCN3编码单元和中心节点提取单元;上下文子图特征提取模块包括GCN4编码单元和池化单元;GCN3和GCN4均为图卷积神经网络模型;
前预训练模型中各模块的连接关系是:
图分割模块的输出分别和中心子图特征提取模块以及上下文子图特征提取模块的输入相连,中心子图特征提取模块以及上下文子图特征提取模块的输出都和自监督学习模块的输入相连;
前预训练模型中各模块的功能是:
图分割模块的功能是对输入数据集中的所有局部子图进行批处理,将其中的每个图都分割为中心子图和上下文子图;自监督学习模块的功能是通过优化损失函数来编码结构信息;中心子图特征提取模块的功能是对批处理后的所有中心子图进行编码表示,提取每个中心子图的特征表示;上下文子图特征提取模块的功能是编码批处理后的所有上下文子图,提取每个上下文子图的特征表示;
其中,中心子图是局部子图中以用户节点为中心,半径小于等于r的部分;上下文子图是局部子图中以用户节点为中心,半径大于等于r的部分;中心子图的特征表示就是用户节点的特征表示;上下文子图的特征表示就是距用户节点距离为r的所有节点的特征表示的平均;r是人为设定的一个半径值,用于确定中心子图和上下文子图的大小并且0rR;
其中,构建前预训练模型,具体包括如下子步骤:
步骤3.1:调用图分割模块对局部子图进行批处理,输出批处理后的中心子图和上下文子图;
步骤3.2:调用中心子图特征提取模块,基于步骤3.1得到的批处理的中心子图,提取每一个批处理过程中所有中心子图的特征表示;
其中,调用GCN3单元编码中心子图;调用中心节点提取单元获得中心子图的特征表示;
步骤3.3:调用上下文子图特征提取模块,基于步骤3.1得到的批处理的上下文子图,提取每一个批处理过程中所有上下文子图的特征表示;
其中,调用GCN4单元编码上下文子图;调用池化单元获得上下文子图的特征表示;
步骤3.4:基于步骤3.2和步骤3.3得到的中心子图的特征表示以及上下文子图的特征表示,计算损失L1,计算公式如式(1)所示:
其中,L1是当中心子图和上下文子图分别来自同一张局部子图G时的损失;和cv分别是来自同一张局部子图G的中心子图和上下文子图的特征表示,v表示局部子图G的中心节点,K表示当前处于图神经网络的第K层;
步骤3.5:基于步骤3.2和步骤3.3得到的中心子图的特征表示以及上下文子图的特征表示,计算损失L2,计算公式如式(2)所示:
其中,L2是当中心子图和上下文子图分别来自不同的局部子图G和G'时的损失;是局部子图G的中心子图的特征表示,v表示局部子图G的中心节点,K表示当前处于第K个图神经网络层;是局部子图G'的上下文子图的特征表示,v'表示局部子图G'的中心节点;
步骤3.6:将步骤3.4和步骤3.5得到的损失值L1和L2代入公式(3),调用自监督学习模块,计算损失L,并利用随机梯度下降法更新步骤3.2到步骤3.3中两个特征提取模块的参数;
L=L1+αL2 (3)
其中,L是综合了L1和L2的整体损失;α是人工设定的超参数,取值范围在0到1之间;
步骤3.7:跳回到步骤3.1继续训练,直到L基本保持不变,跳出循环,跳至步骤四;
至此,从步骤3.1到步骤3.7,完成了前预训练模型的构建;
步骤四:将前预训练模型部分迁移到后预训练模型中,再根据输入数据集构建后预训练模型;
其中,后预训练模型包括特征提取模块、线性层模块和softmax层模块;特征提取模块包括GCN2编码单元、中心节点提取单元以及池化单元;
后预训练模型中各模块的连接关系是:
特征提取模块和线性层模块相连;线性层模块和softmax层模块相连;
后预训练模型通过有监督的方式学习预测已知事件,该后预训练模型中各模块的功能是:
其中,图的特征表示就是局部子图中所有节点的特征表示的平均;中心节点的表示就是局部子图的中心节点的特征表示;
其中,构建后预训练模型,包括如下子步骤:
步骤4.1:提取前预训练模型中GCN3编码单元的参数,并用这些参数初始化后预训练模型中的GCN2编码单元,实现从前预训练模型到后预训练模型的部分迁移;
步骤4.2:特征提取模块对输入数据中的所有局部异构图进行批处理地编码,提取每一个局部异构图的中心节点的特征表示以及局部子图的图特征表示;
步骤4.3:线性层模块对中心节点的特征表示和局部子图的图特征表示拼接后的向量进行编码,得到一个新的特征表示;
步骤4.4:softmax层对线性层输出的特征表示进行归一化,计算概率,输出概率最大的类别作为预测事件类型;
步骤4.5:基于步骤4.4得到的预测事件类型和输入数据集中的已知事件的标签,计算预测损失,并基于该预测损失更新步骤4.2到步骤4.4中的参数;
步骤4.6:跳回到步骤4.2继续训练,直到步骤4.5中预测的损失基本保持不变,跳出至步骤五;
至此,经过步骤三和步骤四,完成了预训练的任务;
步骤五:将后预训练模型整体迁移到微调模型中,再根据输入数据集构建微调模型;
其中,微调模型包括特征提取模块、线性层模块和softmax层模块;特征提取模块包括GCN1编码单元、中心节点提取单元以及池化单元;
微调模型中各模块的连接关系是:
特征提取模块和线性层模块相连;线性层模块和softmax层模块相连;
微调模型通过有监督的方式学习预测最新事件,该微调模型中各模块的功能是:
特征提取模块的功能是对输入数据集中的所有局部子图进行批处理的编码表示,提取每个局部子图的图特征表示以及中心节点的特征表示;线性层的功能是进一步地对局部子图的图特征表示和中心节点的表示编码;softmax层的功能是对线性层输出的特征进行归一化计算,得到带预测事件属于不同类型的概率;
其中,图的特征表示就是局部子图中所有节点的特征表示的平均;中心节点的表示就是局部子图的中心节点的特征表示;
其中,构建微调模型,具体包括如下子步骤:
步骤5.1:提取后预训练模型中所有模块的参数,并用这些参数初始化微调模型中的所有模块的参数,实现从后预训练模型到微调模型的整体迁移学习;
步骤5.2:特征提取模块对输入数据中的所有局部异构图进行批处理地编码,提取每一个局部异构图的中心节点的表示以及局部子图的图特征表示;
步骤5.3:线性层模块对中心节点的表示和局部子图的图特征表示拼接后的向量进行编码,得到一个新的特征表示;
步骤5.4:softmax层对线性层输出的特征表示进行归一化,计算概率,输出概率最大的类别作为预测事件类型;
步骤5.5:基于步骤5.4得到的预测事件类型和输入数据集中的最新事件的标签,计算预测损失,并基于该预测损失更新步骤5.2到步骤5.4中的参数;
步骤5.6:跳回到步骤5.2继续训练,直到步骤5.5中预测的损失基本保持不变,结束本方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古众城信息科技有限公司,未经内蒙古众城信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010736888.0/1.html,转载请声明来源钻瓜专利网。